tento pokus o software jsem zkousel. Pominu pitomou dokumentaci (readme je nepouzitelne a na wiki jsou dulezite veci vycvetlene jen letmo a takove zbytecnosti jako treba kam se uklada trenovaci mnozina s jazyky tam na te jejich doporucovane wiki chybi uplne), tak 261 znaku, co mi dokazal nacist (a jeste k tomu blbe) z naskenovane A4, byl zalostny. K placi.
Soudruzi, takhle ten kapitalismus nevybudujeme.
To se stava, ze soft ma mizernou dokumentaci, spatnou funkcionalitu, zadnou pratelskost k uzivateli a nulovou podporu, ale proc proboha tenhle nedodelek oznacuji verzi 3.0? Ja si blahove myslel, ze s major verzi se budou chtit nejak vysvihnout, blysknout, ukazat... asi jsem moc naivni.
Nová verzia OCR programu Teserract
Vo štvrtok bola vydaná nová verzia (3.0) OpenSource OCR programu Tesseract od firmy Google, ktorá pridáva podporu viacerých nových jazykov a medzi nimi aj slovenčiny a češtiny. Podrobnosti v release notes.
Tato zprávička byla zaslána čtenářem serveru Root.cz pomocí formuláře Přidat zprávičku. Děkujeme!
Dále čtěte…
- Vyšlo YAGF 0.8.9 21. 12. 2011 11:34
- OCRFeeder 0.7 lépe rozpoznává text 2. 8. 2010 10:37
mistospatny vtip
celé vláknoRe: mistospatny vtip
celé vláknoTak ja som skusal starsiu a porovnaval som to s komercnym SW. Bez treningu to davalo lepsie vysledky ako ten komercny za niekolko tisic EUR. Tak teraz neviem.
Re: mistospatny vtip
celé vláknotesseract ma iste poziadavky na kvalitu vstupu napr. min. 300dpi, nema rad alpha kanal, min. vyska pismen atd.
Podla informacii na fore sa vysledok kvality vystupu zvysuje, ak je text na cistom pozadi, obrazok je cierno biely... Cize pred OCR je potrebny pre-processing obrazkov. Presne detaily vsak prirodzene autori projektov (napr. skenovanie vizitiek, automaticke rozoznavanie "SPZ" aut, stavu hladiny vody a pod.), ktore pouzivaju tesseract nezverejnuju.
Re: mistospatny vtip
celé vláknoMozes vysvetlit to "prirodzene"?
Re: mistospatny vtip
celé vláknoAk budes robit komercny sw nad Open Source projektom, tak svoje know-how prirodzene nezverejnis...
Re: mistospatny vtip
celé vláknoTento "nedodelek" je nejaku dobu sucastou androidu (http://android.git.kernel.org/?p=platform/external/tesseract.git;a=summary), pouziva ho (http://code.google.com/p/eyes-free/source/browse/#svn/trunk/ocr/native_code/tesseract%3Fstate%3Dclosed) projekt eyes-free (popis napr. http://www.zdnet.com/blog/cell-phones/go-hands-and-eyes-free-with-starttalking-android-application/4725), pouzivaju ju ho rozne komercne programy/sluzby (napr. http://www.scanbizcards.com/about, http://solutions.weblite.ca/pdfocrx/) a podla vsetkeho aj doc.google.com a www.ocrterminal.com.
Je zadarmo pod slobodnou licencou. Bezi na Win, Lin, Mac. Pouzivaju ho aplikacie na androide a iphone. Viete ponuknut podobny "free" produkt?
To len na dokreslenie, k comu sa vyjadruje a co (resp. kto) je tu na zaplakanie.
Re: mistospatny vtip
celé vlákno:-)
nevzpominam si, ze bych si stezoval na to, ze je free. Ja jsem hodnotil tenhle kus softwaru. Stahl jsem si , vyzkousel a ohodnotil. O tom byl muj prispevek. Takze to, k cemu se tesseract pouziva a na cem vsem bezi je mi celkem jedno.
Preji prijemny den.
Re: mistospatny vtip
celé vláknopromin, obcas jsem hrozne prijemnej.
slo mi o to,ze mi pises, kde vsude se to pouziva a ze to je free. to ej hezky, ze je to hojne pouzivane a ze to je free, ale co to ma spolecneho s tim, ze na mych souborech to melo velmi zalostne vysledky a ze to ma hodne mizernou dokumentaci, coz byly veci, na ktere jsem si stezoval?
Na ten samy soubor kdyz jsem postval trial verzi finereaderu, tak to zkonvertovala bez nejmensich problemu.
Re: mistospatny vtip
celé vláknoViem, ze si sa neztazoval, ze je "free", ale "toto je liga, ktoru tento projekt hra". Ostatne veci, co som skusal a su "free" boli na tom horsie. Pozri si napr. toto porovnanie http://www.splitbrain.org/blog/2010-06/15-linux_ocr_software_comparison
IMHO finereader je najlepsi OCR program, ktory je k dispozicii, ale stale nie je dokonaly (keby bol, tak by neboli potrebne projekty ako su http://www.pgdp.net/c/ resp. http://zfproof.dot.sk/c/).
Dalej finereader je komplexny program, kym tesseract je skor kniznica. Preto vznikaju projekty ako http://vietocr.sf.net/ ktore sa snazia urobit jednoduchy pre-procesing vstupneho obrazku, OCR a nasledny postprocessing s cielom dosiahnut lepsi vysledok (a pouzivatelsky komfort ;-) ).
Tie aktivne pouzitia som uviedol preto, lebo su dokazom toho, ze tesseract je "dospely" projekt (ktory si zasluzi cislo verzie 3.00 :-) ), pouzitelny aj v komernom prostredi (v androide je dokonca starsia verzia, hoci google verziu 3.00 interne pouzival/testoval uz skoro rok). Podla mna problem tvojej reakcie bol ten, ze ty potrebujes iny program ako si testoval a preto tvoja kritika bola prehnana az nemiestna...
Re: mistospatny vtip
celé vláknoV programe chyba nebude, ten sa vyvija uz od roku 1985 takze je mozno starsi ako ty.
An OCR Engine that was developed at HP Labs between 1985 and 1995... and now at Google.
Re: mistospatny vtip
celé vláknoto nic neznamena, ze je o dvanact let mladsi nez ja, navic to, ze to vzniklo v HP je spis nevyhoda. Zkousel jste nekdy to OCR, co HP pribaluje ke svym tiskarnam?
YAGF - best...
celé vláknoPodle me je YAGF pro linux nejlepsi.
Nebo pokud "si sezenete" ;-) portable verzi Finereader-u 8 nebo 9 verzi :p

