Nová verze OCR enginu Tesseract 5.0, rychlejší a úspornější

1. 12. 2021

Dlouho očekávané vydání OCR enginu Tesseract 5.0 je tady a jde o vydání velké. Od vydání alfa verze pětkové řady uběhl už celý rok. Tesseract využívá neuronové sítě a poradí si s optickým rozpoznáváním znaků ve více než stovce jazyků.

Tesseract 5.0 mimo jiné zvyšuje výkon operací díky přechodu od číselného typu double k fast float (pro model trénování a rozpoznávání znaků). Kromě vyšší rychlosti z této změny plyne i menší spořeba paměti. Dále nechybí nativní podpora pro Apple ARMy (a obecně platformu ARM), vylepšení buildovacího systému i různých API.

Phoronix připomíná, že základy vývoje Tesseractu lze vystopovat zpět až do 80. let u firmy Hewlett-Packard, projekt byl na open-source licenci převeden v roce 2005. Poté se do vývoje přidal Google, který se v roce 2018 ale zase stáhl a i proto se pětková verze rodila tak dlouho. Brewster Kahle z Internet Archive loni prohlásil, že i když jeho OCR nebylo [v minulých testech IA] tak dobré jako různá proprietární řešení, to se změnilo a Tesseract je díky nové architektuře nyní stejně dobrý, ne-li lepší.

Vstoupit do diskuse

Zasílat nově přidané názory e-mailem

Našli jste v článku chybu?

David Ježek

Příznivec open-source rád píšící i o ne-IT tématech. Odpůrce softwarových patentů a omezování občanských svobod ve prospěch korporací.

Sdílet

Autor zprávičky

David Ježek