Hlavní navigace

Editace PDF v Linuxu: velký oříšek

Pavel Chalupa 3. 9. 2008

O editaci PDF se v poslední době hodně hovoří, ale situace rozhodně není ideální. Pokusili jsme se nalézt nástroje pro práci s PDF v Linuxu. Zkušenější uživatelé již tuší, že práce s PDF je sama o sobě oříškem. Podívejme se, jaký je pro editaci PDF aktuálně k dispozici svobodný software a co (ne)umí.

Krita – PDF import

Krita je bitmapový grafický editor, který je součástí kancelářského balíku KOffice. Nejnovější větev 1.6 přinesla řadu vylepšení a novinek, mezi kterými nechybí ani import PDF dokumentů.

Krita

Import do programu Krita nabízí převedení PDF do bitmapy s vyšším rozlišením. Při převodu máte možnost zvolit si konkrétní rozlišení dpi pro výslednou bitmapu. Vícestránkový PDF dokument se do programu Krita naimportuje ve formě vrstev, každá stránka je pak zvlášť.

Krita vrstvy

Načítání PDF funguje bez větších problémů, bohužel tím možnosti zpracování v Krita končí a další postup s takto načteným dokumentem je zpracování bitmapy. Zpracovával jsem PDF soubory, které v sobě obsahovaly naskenované textové dokumenty ve vyšším rozlišení, takže tento zdánlivě nelogický postup je opodstatněný.

Scribus

Dalším programem, který se chlubí schopností zpracovávat PDF je sázecí DTP program Scribus. Ten nabízí otevření PDF souboru, nicméně se mi nepodařilo touto volbou otevřít žádný PDF. Vyzkoušel jsem samozřejmě i PDF, které si sám Scribus předtím vytvořil, ale ani s těmi si bohužel neporadil. Pouze ohlásí kritickou chybu „Soubor není v přijatelném formátu“ bez dalšího vysvětlení.

Scribus

U exportu PDF je na tom Scribus podstatně lépe a kromě běžných voleb (komprese a rozlišení obrázků) nabízí například ještě možnost přibalit písma. Navíc je možné nastavit verzi PDF 1.3, 1.4 a 1.5 kde verze 1.3 nabízí nejširší kompatibilitu PDF dokumentu.

OpenOffice.org

Ani kancelářský balík OpenOffice.org nechce zůstat pozadu a je obecně znám svou schopností exportovat PDF. V aktuální verzi 2.4 je práce s PDF v OpenOffice.org omezena pouze na export s možností nastavit kompresi a rozlišení obrázků. Voleb je samozřejmě hodně, ale většina z nich se netýká přímo obsahu dokumentu. I v poslední vývojové verzi 3.0 jsou exportní volby takto omezeny.

OOo

Připravované verze OOo se chlubí možností importu PDF. Ten je k dispozici pro verzi OpenOffice 3.0 a pokud jej chcete využít, budete potřebovat zvláštní rozšíření. Bohužel vše je zatím ve stádiu betaverze, což je znát na první pohled a rozšíření se mi do OpenOffice.org 3.0 Beta 2 nepodařilo ani nainstalovat. Ačkoliv lze na internetu dohledat, že chyba, o kterou se jedná, byla již opravena, přesto není možno v aktuální vývojové verzi plugin nainstalovat.

Podpora importu PDF pro OOo 3.0 je ale velmi slibná a uživatelé ji napjatě očekávají. Až to bude aktuální, napíšeme o ní víc v samostatném článku rozebírajícím všechny podstatné novinky OOo 3.0.

KWord

Kromě programu Krita dokáže v KOffice pracovat s PDF také word editor KWord. Testovaný import PDF v aplikaci KWord nedopadl nejhůř. Pro načtení obsahu PDF je využívána knihovna libpdfimport. Správně se načetly grafické objekty, ale problém byl s nesprávnou velikostí písma textu po importu. Odstavce se ne vždy správně převedly a občas zůstaly rozdělené. Pokud se importoval dokument například se dvěma sloupci, nebyly odstavce pro každý sloupec zvlášť, ale vždy celý řádek přes oba sloupce.

Výsledek sice není stoprocentní, ale pro základní úpravu dokumentu či získání obrázků a samotných textů je velmi užitečný. Formátování se sice rozpadá, ale pokud máme zájem o obsah, rozhodně se nám služby KWordu hodí.

Další software pro práci s PDF

Existují i další nástroje pro jednoduchou práci s PDF dokumenty. Pro spojování více PDF do jednoho vícestránkového souboru existuje větší množství softwaru. Nevýhodou pro někoho může být, že tento software se ovládá z příkazové řádky. Pokud se však na následujících pár příkladů podíváte, je celkem jasné, co příkazy provedou:

Ghostscript

$ gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=vsechnystranky.pdf stranka1.pdf stranka2.pdf

joinPDF

$ joinpdf vsechnystranky.pdf stranka1.pdf stranka2.pdf stranka3.pdf

pdftk

$ pdftk *.pdf cat output vsechnystranky.pdf

Závěr

S aktuálním stavem nástrojů pro práci s PDF to není pro běžného uživatele moc valné. Většina programů má vážné technické problémy a za použitelný je možno označit snad jen KWord, který během testů dopadl nejlépe. Pokud se vývojářům podaří dokončit PDF plugin do OpenOffice.org, mohla by se situace výrazně zlepšit.

Anketa

Uvítali byste bezproblémovou editaci PDF?

Našli jste v článku chybu?

3. 9. 2008 3:03

Airborn (neregistrovaný)
Jak píše nickname, někdy to prostě nejde jinak. Nezapomínejte, že součástí PDF nemusí být jen text, ale i vektorová grafika. Pochopitelně, PDF skutečně není stavěné na úpravy a je v podstatě zamýšlené jako koncový výstupní formát. Jenomže to u Adobe zmákli natolik dobře, že v řadě případů PDF může posloužit i jako formát vstupní. Prostě se občas hodí možnost vytáhnout z PDF cokoliv - a to snad bylo jádro sdělení článku Pavla Chalupy.

3. 9. 2008 0:50

Lael Ophir (neregistrovaný)
Proboha lidi, proč chcete editovat výstupní formát? Chce snad někdo editovat PCL nebo TIFF dokumenty? Chápu to, když originál neexistuje, ale pak bych jako optimální viděl vytáhnout z PDF čistý text, a dokument znovu složit. PDF totiž není stavěné na úpravy.
DigiZone.cz: ČRo rozšiřuje DAB do Berouna

ČRo rozšiřuje DAB do Berouna

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

Podnikatel.cz: EET zvládneme, budou horší zákony

EET zvládneme, budou horší zákony

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Lupa.cz: Propustili je z Avastu, už po nich sahá ESET

Propustili je z Avastu, už po nich sahá ESET

Lupa.cz: Co se dá měřit přes Internet věcí

Co se dá měřit přes Internet věcí

Vitalia.cz: Láska na vozíku: Přitažliví jsme pro tzv. pečovatelky

Láska na vozíku: Přitažliví jsme pro tzv. pečovatelky

Lupa.cz: Google měl výpadek, nejel Gmail ani YouTube

Google měl výpadek, nejel Gmail ani YouTube

Podnikatel.cz: EET: Totálně nezvládli metodologii projektu

EET: Totálně nezvládli metodologii projektu

Lupa.cz: Insolvenční řízení kvůli cookies? Vítejte v ČR

Insolvenční řízení kvůli cookies? Vítejte v ČR

DigiZone.cz: Sony KD-55XD8005 s Android 6.0

Sony KD-55XD8005 s Android 6.0

Podnikatel.cz: Víme první výsledky doby odezvy #EET

Víme první výsledky doby odezvy #EET

Vitalia.cz: „Připluly“ z Německa a možná obsahují jed

„Připluly“ z Německa a možná obsahují jed

Měšec.cz: Finančním poradcům hrozí vracení provizí

Finančním poradcům hrozí vracení provizí

Vitalia.cz: Říká amoleta - a myslí palačinka

Říká amoleta - a myslí palačinka

Root.cz: Vypadl Google a rozbilo se toho hodně

Vypadl Google a rozbilo se toho hodně

Vitalia.cz: To není kašel! Správná diagnóza zachrání život

To není kašel! Správná diagnóza zachrání život

Podnikatel.cz: Prodává přes internet. Kdy platí zdravotko?

Prodává přes internet. Kdy platí zdravotko?

DigiZone.cz: NG natáčí v Praze seriál o Einsteinovi

NG natáčí v Praze seriál o Einsteinovi

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte