tento pokus o software jsem zkousel. Pominu pitomou dokumentaci (readme je nepouzitelne a na wiki jsou dulezite veci vycvetlene jen letmo a takove zbytecnosti jako treba kam se uklada trenovaci mnozina s jazyky tam na te jejich doporucovane wiki chybi uplne), tak 261 znaku, co mi dokazal nacist (a jeste k tomu blbe) z naskenovane A4, byl zalostny. K placi.
Soudruzi, takhle ten kapitalismus nevybudujeme.
To se stava, ze soft ma mizernou dokumentaci, spatnou funkcionalitu, zadnou pratelskost k uzivateli a nulovou podporu, ale proc proboha tenhle nedodelek oznacuji verzi 3.0? Ja si blahove myslel, ze s major verzi se budou chtit nejak vysvihnout, blysknout, ukazat... asi jsem moc naivni.
tesseract ma iste poziadavky na kvalitu vstupu napr. min. 300dpi, nema rad alpha kanal, min. vyska pismen atd.
Podla informacii na fore sa vysledok kvality vystupu zvysuje, ak je text na cistom pozadi, obrazok je cierno biely... Cize pred OCR je potrebny pre-processing obrazkov. Presne detaily vsak prirodzene autori projektov (napr. skenovanie vizitiek, automaticke rozoznavanie "SPZ" aut, stavu hladiny vody a pod.), ktore pouzivaju tesseract nezverejnuju.
Tento "nedodelek" je nejaku dobu sucastou androidu (http://android.git.kernel.org/?p=platform/external/tesseract.git;a=summary), pouziva ho (http://code.google.com/p/eyes-free/source/browse/#svn/trunk/ocr/native_code/tesseract%3Fstate%3Dclosed) projekt eyes-free (popis napr. http://www.zdnet.com/blog/cell-phones/go-hands-and-eyes-free-with-starttalking-android-application/4725), pouzivaju ju ho rozne komercne programy/sluzby (napr. http://www.scanbizcards.com/about, http://solutions.weblite.ca/pdfocrx/) a podla vsetkeho aj doc.google.com a www.ocrterminal.com.
Je zadarmo pod slobodnou licencou. Bezi na Win, Lin, Mac. Pouzivaju ho aplikacie na androide a iphone. Viete ponuknut podobny "free" produkt?
To len na dokreslenie, k comu sa vyjadruje a co (resp. kto) je tu na zaplakanie.
promin, obcas jsem hrozne prijemnej.
slo mi o to,ze mi pises, kde vsude se to pouziva a ze to je free. to ej hezky, ze je to hojne pouzivane a ze to je free, ale co to ma spolecneho s tim, ze na mych souborech to melo velmi zalostne vysledky a ze to ma hodne mizernou dokumentaci, coz byly veci, na ktere jsem si stezoval?
Na ten samy soubor kdyz jsem postval trial verzi finereaderu, tak to zkonvertovala bez nejmensich problemu.
Viem, ze si sa neztazoval, ze je "free", ale "toto je liga, ktoru tento projekt hra". Ostatne veci, co som skusal a su "free" boli na tom horsie. Pozri si napr. toto porovnanie http://www.splitbrain.org/blog/2010-06/15-linux_ocr_software_comparison
IMHO finereader je najlepsi OCR program, ktory je k dispozicii, ale stale nie je dokonaly (keby bol, tak by neboli potrebne projekty ako su http://www.pgdp.net/c/ resp. http://zfproof.dot.sk/c/).
Dalej finereader je komplexny program, kym tesseract je skor kniznica. Preto vznikaju projekty ako http://vietocr.sf.net/ ktore sa snazia urobit jednoduchy pre-procesing vstupneho obrazku, OCR a nasledny postprocessing s cielom dosiahnut lepsi vysledok (a pouzivatelsky komfort ;-) ).
Tie aktivne pouzitia som uviedol preto, lebo su dokazom toho, ze tesseract je "dospely" projekt (ktory si zasluzi cislo verzie 3.00 :-) ), pouzitelny aj v komernom prostredi (v androide je dokonca starsia verzia, hoci google verziu 3.00 interne pouzival/testoval uz skoro rok). Podla mna problem tvojej reakcie bol ten, ze ty potrebujes iny program ako si testoval a preto tvoja kritika bola prehnana az nemiestna...