Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia Tuesday TopDrive KupDnes Navrcholu Bomba NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Hlavní navigace

Nová verzia OCR programu Teserract

Vo štvrtok bola vydaná nová verzia (3.0) OpenSource OCR programu Tesseract od firmy Google, ktorá pridáva podporu viacerých nových jazykov a medzi nimi aj slovenčiny a češtiny. Podrobnosti v release notes.

Tato zprávička byla zaslána čtenářem serveru Root.cz pomocí formuláře Přidat zprávičku. Děkujeme!

Dále čtěte…         

Předchozí zprávička Následující zprávička        
xaint
xaint (neregistrovaný) 212.80.70.---
4. 10. 2010 8:39 Nový

mistospatny vtip

celé vlákno

tento pokus o software jsem zkousel. Pominu pitomou dokumentaci (readme je nepouzitelne a na wiki jsou dulezite veci vycvetlene jen letmo a takove zbytecnosti jako treba kam se uklada trenovaci mnozina s jazyky tam na te jejich doporucovane wiki chybi uplne), tak 261 znaku, co mi dokazal nacist (a jeste k tomu blbe) z naskenovane A4, byl zalostny. K placi.
Soudruzi, takhle ten kapitalismus nevybudujeme.
To se stava, ze soft ma mizernou dokumentaci, spatnou funkcionalitu, zadnou pratelskost k uzivateli a nulovou podporu, ale proc proboha tenhle nedodelek oznacuji verzi 3.0? Ja si blahove myslel, ze s major verzi se budou chtit nejak vysvihnout, blysknout, ukazat... asi jsem moc naivni.

Palo
Palo (neregistrovaný) ---.95-102-211.t-com.sk
4. 10. 2010 10:50 Nový

Re: mistospatny vtip

celé vlákno

Tak ja som skusal starsiu a porovnaval som to s komercnym SW. Bez treningu to davalo lepsie vysledky ako ten komercny za niekolko tisic EUR. Tak teraz neviem.

zdenop
zdenop (neregistrovaný) ---.intime.sk
4. 10. 2010 11:52 Nový

Re: mistospatny vtip

celé vlákno

tesseract ma iste poziadavky na kvalitu vstupu napr. min. 300dpi, nema rad alpha kanal, min. vyska pismen atd.

Podla informacii na fore sa vysledok kvality vystupu zvysuje, ak je text na cistom pozadi, obrazok je cierno biely... Cize pred OCR je potrebny pre-processing obrazkov. Presne detaily vsak prirodzene autori projektov (napr. skenovanie vizitiek, automaticke rozoznavanie "SPZ" aut, stavu hladiny vody a pod.), ktore pouzivaju tesseract nezverejnuju.

sasdfasdf
sasdfasdf (neregistrovaný) 195.178.95.---
4. 10. 2010 13:27 Nový

Re: mistospatny vtip

celé vlákno

Mozes vysvetlit to "prirodzene"?

zdenop
zdenop (neregistrovaný) 195.91.79.---
4. 10. 2010 21:23 Nový

Re: mistospatny vtip

celé vlákno

Ak budes robit komercny sw nad Open Source projektom, tak svoje know-how prirodzene nezverejnis...

zdenop
zdenop (neregistrovaný) ---.intime.sk
4. 10. 2010 12:21 Nový

Re: mistospatny vtip

celé vlákno

Tento "nedodelek" je nejaku dobu sucastou androidu (http://android.git.kernel.org/?p=platform/external/tesseract.git;a=summary), pouziva ho (http://code.google.com/p/eyes-free/source/browse/#svn/trunk/ocr/native_code/tesseract%3Fstate%3Dclosed) projekt eyes-free (popis napr. http://www.zdnet.com/blog/cell-phones/go-hands-and-eyes-free-with-starttalking-android-application/4725), pouzivaju ju ho rozne komercne programy/sluzby (napr. http://www.scanbizcards.com/about, http://solutions.weblite.ca/pdfocrx/) a podla vsetkeho aj doc.google.com a www.ocrterminal.com.

Je zadarmo pod slobodnou licencou. Bezi na Win, Lin, Mac. Pouzivaju ho aplikacie na androide a iphone. Viete ponuknut podobny "free" produkt?

To len na dokreslenie, k comu sa vyjadruje a co (resp. kto) je tu na zaplakanie.

Xaint
Xaint (neregistrovaný) 212.80.70.---
4. 10. 2010 16:06 Nový

Re: mistospatny vtip

celé vlákno

:-)
nevzpominam si, ze bych si stezoval na to, ze je free. Ja jsem hodnotil tenhle kus softwaru. Stahl jsem si , vyzkousel a ohodnotil. O tom byl muj prispevek. Takze to, k cemu se tesseract pouziva a na cem vsem bezi je mi celkem jedno.
Preji prijemny den.

xaint
xaint (neregistrovaný) 212.80.70.---
4. 10. 2010 16:49 Nový

Re: mistospatny vtip

celé vlákno

promin, obcas jsem hrozne prijemnej.
slo mi o to,ze mi pises, kde vsude se to pouziva a ze to je free. to ej hezky, ze je to hojne pouzivane a ze to je free, ale co to ma spolecneho s tim, ze na mych souborech to melo velmi zalostne vysledky a ze to ma hodne mizernou dokumentaci, coz byly veci, na ktere jsem si stezoval?
Na ten samy soubor kdyz jsem postval trial verzi finereaderu, tak to zkonvertovala bez nejmensich problemu.

zdenop
zdenop (neregistrovaný) 195.91.79.---
4. 10. 2010 21:21 Nový

Re: mistospatny vtip

celé vlákno

Viem, ze si sa neztazoval, ze je "free", ale "toto je liga, ktoru tento projekt hra". Ostatne veci, co som skusal a su "free" boli na tom horsie. Pozri si napr. toto porovnanie http://www.splitbrain.org/blog/2010-06/15-linux_ocr_software_comparison

IMHO finereader je najlepsi OCR program, ktory je k dispozicii, ale stale nie je dokonaly (keby bol, tak by neboli potrebne projekty ako su http://www.pgdp.net/c/ resp. http://zfproof.dot.sk/c/).

Dalej finereader je komplexny program, kym tesseract je skor kniznica. Preto vznikaju projekty ako http://vietocr.sf.net/ ktore sa snazia urobit jednoduchy pre-procesing vstupneho obrazku, OCR a nasledny postprocessing s cielom dosiahnut lepsi vysledok (a pouzivatelsky komfort ;-) ).

Tie aktivne pouzitia som uviedol preto, lebo su dokazom toho, ze tesseract je "dospely" projekt (ktory si zasluzi cislo verzie 3.00 :-) ), pouzitelny aj v komernom prostredi (v androide je dokonca starsia verzia, hoci google verziu 3.00 interne pouzival/testoval uz skoro rok). Podla mna problem tvojej reakcie bol ten, ze ty potrebujes iny program ako si testoval a preto tvoja kritika bola prehnana az nemiestna...

UbuntuProfessional
UbuntuProfessional (neregistrovaný) ---.orange.sk
4. 10. 2010 13:08 Nový

Re: mistospatny vtip

celé vlákno

V programe chyba nebude, ten sa vyvija uz od roku 1985 takze je mozno starsi ako ty.

An OCR Engine that was developed at HP Labs between 1985 and 1995... and now at Google.

xaint
xaint (neregistrovaný) 212.80.70.---
4. 10. 2010 16:50 Nový

Re: mistospatny vtip

celé vlákno

to nic neznamena, ze je o dvanact let mladsi nez ja, navic to, ze to vzniklo v HP je spis nevyhoda. Zkousel jste nekdy to OCR, co HP pribaluje ke svym tiskarnam?

El.
El. (neregistrovaný) ---.net.upcbroadband.cz
5. 10. 2010 13:10 Nový

YAGF - best...

celé vlákno

Podle me je YAGF pro linux nejlepsi.
Nebo pokud "si sezenete" ;-) portable verzi Finereader-u 8 nebo 9 verzi :p

YAGF -> http://symmetrica.net/cuneiform-linux/yagf-en.html

soft
soft (neregistrovaný) ---.anonymouse.org
9. 10. 2010 14:28 Nový

Re: Nová verzia OCR programu Teserract

celé vlákno
Zasílat nově přidané příspěvky e-mailem        

Přehled názorů

mistospatny vtip
xaint 4. 10. 2010 08:39
├ 
Re: mistospatny vtip
Palo 4. 10. 2010 10:50
│
└ 
Re: mistospatny vtip
zdenop 4. 10. 2010 11:52
│
 
└ 
Re: mistospatny vtip
sasdfasdf 4. 10. 2010 13:27
│
 
 
└ 
Re: mistospatny vtip
zdenop 4. 10. 2010 21:23
├ 
Re: mistospatny vtip
zdenop 4. 10. 2010 12:21
│
├ 
Re: mistospatny vtip
Xaint 4. 10. 2010 16:06
│
└ 
Re: mistospatny vtip
xaint 4. 10. 2010 16:49
│
 
└ 
Re: mistospatny vtip
zdenop 4. 10. 2010 21:21
└ 
Re: mistospatny vtip
UbuntuProfessional 4. 10. 2010 13:08
 
└ 
Re: mistospatny vtip
xaint 4. 10. 2010 16:50
YAGF - best...
El. 5. 10. 2010 13:10
Re: Nová verzia OCR programu Teserract
soft 9. 10. 2010 14:28