Vlákno názorů k článku
Rozšíření OpenOffice pro editaci PDF od funtom - PDF je standardem ISO a lze ho importovat...

  • Článek je starý, nové názory již nelze přidávat.
  • 4. 7. 2008 8:19

    funtom (neregistrovaný)
    PDF je standardem ISO a lze ho importovat do Google Docs. Očekávám, že ho tam dříve či později půjde i editovat.
  • 4. 7. 2008 9:48

    bez přezdívky
    PDF není ISO standardem. ISO standardizací prošla pouze specifická podmnožina PDF (např. PDF-X/1a či PDF-X/3). PDF je velmi široký formát a neustále se vyvíjí.

    Neočekávejte ale od editace pdf zázraky. Hrozně záleží na tom, jak bylo pdf vytvořeno a za jakým účelem. Pokud se jedná o finální výstup nebo export z OOo apod., tak tam je už minimum původních kontextových údajů (např. zmizely odstavce) a naopak tam přibyla spousta věcí, které nejsou tak úplně triviální (např. přibalená písma, tedy přesněji jejich podmnožina).

    I takový Adobe Illustrator, který má od verze 10 jako interní formát PDF (předtím to byl postscript), nepracuje s každým PDF. Jako svůj formát využívá PDF rozšířené o mnoho věcí, aby byla zachována plná editovatelnost.

    Editace PDF fakt není banalita. Je to primárně prezentační formát a je to znát.
  • 6. 7. 2008 1:30

    Rejpal (neregistrovaný)
    PDF není ISO standardem. ISO standardizací prošla pouze specifická podmnožina PDF (např. PDF-X/1a či PDF-X/3). PDF je velmi široký formát a neustále se vyvíjí.
    Copak ISO 32000-1:2008 není kompletní PDF 1.7? Samozřejmě nějaká ta extra rozšíření v Acrobatu nepočítám. Ohledně editovatelnosti, tam je nutno souhlasit. Ale už jinde jsem poznamenal, že u určitých typů dokumentů připadá "inteligentní" rekonstrukce připadá ještě celkem v úvahu (ve stylu OCR, s tím, že není třeba rozpozoznávat písmena, ovšem třeba rušit hyphenation a hádat text flow pochopitelně stále ještě nutné je). Nicméně i to pochopitelně bude fungovat jen u opravdu hodně pravidelných dokumentů, typicky knih.
  • 7. 7. 2008 3:19

    bez přezdívky
    mno, jednak jsem v době, kdy jsem psal svůj kmentář, ještě o standardizaci PDF 1.7 nevěděl (mea culpa) a jednak jsem celkově vůči tomu silně skeptický. Hlavně proto, protože s PDF denně dělám, zpracovávám ho, vytvářím, upravuji...

    Přestože PDF považuju za zatím nejlepší formát v oblasti prezentace dat, je to formát hrozně průserový kvůli šíři možností, které má.

    Jedna z věcí, které mne v PDF děsně štve je právě písmo. PDF má čtyři hlavní možnosti, jak písmo vložit a dosud si bohužel většina aplikací (a opensource obzvlášť) vybírá ty nejpitomější dvě - křivky a vlastní znaková sada. V obou případech je text nezpracovatelný bez skutečného OCR. Chápu důvody, proč se tohle ve specifikaci PDF objevilo, ale hrubě s tím nesouhlasím, protože takové PDF je vhodné jen pro tisk a zobrazení. Vyhledávání a další, hlavně sémantické zpracování je velmi obtížné (čtěte nyní prakticky nemožné).

    Takový věcí bych z rukávu vysypal patnáct do tuctu. :( V podstatě každé dodané PDF mi vyhodí nějaký problém na preflightu. Tekhle široký formát je prostě obrovské riziko a ani svaté ISO ho nezachrání.


    P.S.: PDF se ale nevzdám. Znovu opakuju, že to je pro prezentační účely zatím to nejlepší, co je k dispozici. Bohužel.
  • 8. 7. 2008 23:50

    Rejpal (neregistrovaný)
    Já myslel, že existence toho standardizačního procesu pro celé PDF 1.7 je veřejně známá. :-) Aspoň mám pocit, že o ní vím minimálně půlrok, pokud ne víc než rok. A co pdfTeX a XeTeX? Pozoroval jste na nich nějaké problémy, pokud Vám něco z nich vylezlého přišlo pod ruku? A nemáme na spolehlivý profi tisk hlavně PDF/X? :-) Jinak můj vztah k PDF je podobný, je to nejlepší ze všech špatných formátů. :-)
  • 9. 7. 2008 0:06

    Rejpal (neregistrovaný)
    Ha, já to věděl: http://it.slashdot.org/article.pl?sid=07/01/29/1114228 - já tušil, že jsem se to dozvěděl někdy na začátku minulého roku, a trefil jsem se skoro přesně. :]