Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia Tuesday TopDrive KupDnes Navrcholu Bomba NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Hlavní navigace

Import PDF do betaverze OpenOffice.org 3

Sun vydal betaverzi rozšíření, které umožňuje import PDF do OpenOffice.org a jeho úpravy. Rozšíření funguje jen s betaverzí OpenOffice.org 3.

Tato zprávička byla zaslána čtenářem serveru Root.cz pomocí formuláře Přidat zprávičku. Děkujeme!

Předchozí zprávička Následující zprávička        
zer01 zer01
12. 6. 2008 12:59 Nový

Tak jsem to zkusil

celé vlákno
Zdarte vseci, tak jsem to zkusil je to rychle jen bych si to predstavoval ze to bude napr. ve writeru a ne v draw, ale i tak je to celkem dobry pokrok a preju borcum at to vychytaji, vse co bude umet OO.o proti M$ je jenom dobre.
petr_p
petr_p (neregistrovaný)
12. 6. 2008 13:48 Nový

Re: Tak jsem to zkusil

celé vlákno
Do draw je to proto, že PDF je grafický formát. Prakticky se jedná o koláž. Žádné informace typu toto je nadpis, toto seznam, toto tabulka v PDF nenajdete.
zer01 zer01
12. 6. 2008 14:09 Nový

Re: Tak jsem to zkusil

celé vlákno
Tak apson nejak zjednodusit treba kopirovani mezi jednotlivimi aplikacemi, rad bych totiz treba z nekterych pdf rad dostal do calcu nebo writeru a je to dost pracne.
Rejpal
Rejpal (neregistrovaný)
12. 6. 2008 15:06 Nový

Re: Tak jsem to zkusil

celé vlákno
Osobně myslím, že i informace tohoto typu jdou ze "slušných" dokumentů PDF ve většině případů vyextrahovat. Nicméně je to tak trošku úkol pro umělou inteligenci, zhruba ve stylu OCR, ale trošku jednodušší: Přesné znaky jsou zachovány, dokonce máme přesné informace o tom, jakým písmem je psána jaká část textu, takže můžeme vydedukovat hlavní styly, ale je zapotřebí identifikovat logicky oddělené části textu (hladká sazba, poznámky na okraji, záhlaví a zápatí), jejichž data mohou ve skutečnosti být všelijak promíchaná, rozpoznat seznamy, číslované seznamy a podobně. Nicméně nemožné mi to nepřijde, i když si nejsem jist, jestli zrovna tohle je něco, o co se Sun tímhle počinem pokouší. To už je v současnosti pro jednotlivce perspektivnější (rychlejší a jednodušší) jít do obchodu, koupit FineReader a v něm ten PDF soubor otevřít.
Lael Ophir
Lael Ophir (neregistrovaný)
12. 6. 2008 20:09 Nový

Re: Tak jsem to zkusil

celé vlákno
Mě to připadá jako importovat PCL. Řada aplikací si sama vytváří kombinační znaky, používá kerning pomocí mezer záporné velikosti, odrážka je písmeno B v nějakém fontu, záhlaví a zápatí stránky nelze rozeznat od obsahu... Import PDF musí mít nutně tristní výsledky. A proč dělat něco, co v principu nemůže přinést použitelný výsledek?
nechtej
nechtej (neregistrovaný)
12. 6. 2008 20:15 Nový

Zkusil jsem to

celé vlákno
pod windowsema a vynechává mi to český znaky, ale pokrok to je. Jak na linuxu? OO3beta jsem zatim na ubuntu (na ntb) nezkoušel.
Zasílat nově přidané příspěvky e-mailem        

Přehled názorů

Tak jsem to zkusil
zer01 zer01 12. 6. 2008 12:59
└ 
Re: Tak jsem to zkusil
petr_p 12. 6. 2008 13:48
 
├ 
Re: Tak jsem to zkusil
zer01 zer01 12. 6. 2008 14:09
 
└ 
Re: Tak jsem to zkusil
Rejpal 12. 6. 2008 15:06
 
 
└ 
Re: Tak jsem to zkusil
Lael Ophir 12. 6. 2008 20:09
Zkusil jsem to
nechtej 12. 6. 2008 20:15