Hlavní navigace

Nová verze OCR enginu Tesseract 5.0, rychlejší a úspornější

1. 12. 2021

Sdílet

OCR Autor: David Ježek, podle licence: CC BY-SA 4.0

Dlouho očekávané vydání OCR enginu Tesseract 5.0 je tady a jde o vydání velké. Od vydání alfa verze pětkové řady uběhl už celý rok. Tesseract využívá neuronové sítě a poradí si s optickým rozpoznáváním znaků ve více než stovce jazyků.

Tesseract 5.0 mimo jiné zvyšuje výkon operací díky přechodu od číselného typu doublefast float (pro model trénování a rozpoznávání znaků). Kromě vyšší rychlosti z této změny plyne i menší spořeba paměti. Dále nechybí nativní podpora pro Apple ARMy (a obecně platformu ARM), vylepšení buildovacího systému i různých API.

Phoronix připomíná, že základy vývoje Tesseractu lze vystopovat zpět až do 80. let u firmy Hewlett-Packard, projekt byl na open-source licenci převeden v roce 2005. Poté se do vývoje přidal Google, který se v roce 2018 ale zase stáhl a i proto se pětková verze rodila tak dlouho. Brewster Kahle z Internet Archive loni prohlásil, že i když jeho OCR nebylo [v minulých testech IA] tak dobré jako různá proprietární řešení, to se změnilo a Tesseract je díky nové architektuře nyní stejně dobrý, ne-li lepší.

Našli jste v článku chybu?
  • Aktualita je stará, nové názory již nelze přidávat.