Hlavní navigace

Hledání svobodného formátu

Petr Krčmář

V souvislosti se svobodným software se často hovoří také o svobodných formátech souborů pro přenos dat. Formátů je velké množství, ale jen málo z nich splňuje všechny požadavky. Přinášíme obecné shrnutí situace a možnosti, jak ji řešit.

Možnost jednoduché výměny informací je stará jako lidstvo samo. Od začátku jsme vyvíjeli způsoby komunikace, ať to byly kouřové signály, nebo zvuky bubnů. Dohodnout se společným jazykem byl náš cíl. Dokonce jsme vymysleli univerzální jazyk Esperanto.

Pak přišly na řadu počítače. V počátcích to byly uzavřené stroje a každý z nich byl unikátním kusem hardware. Jak počítačů přibývalo, objevila se nutnost výměny dat. V tu dobu přišly operační systémy, které sjednotily prostředí i datové struktury.

Dalším krokem byl Internet, kde se jako univerzální formát pro výměnu dat prosadilo především HTML, které je univerzální, multiplatformní a vcelku bezproblémové.

Tou dobou to vypadalo růžově a byli jsme rádi, jak nám to funguje. Dokonce i válka prohlížečů, která Internet rozdělila na dva nekompatibilní tábory, nás nakonec zase tak nepoznamenala.

Pak ale přišly počítače do kanceláří a objevil se veliký problém. Potřebujeme univerzální formát dat, který by nám umožňoval bez problémů komunikovat s našimi kolegy a partnery. A tady jsme se zasekli. Konec, tma.

Samozřejmě se problém netýká jen textových dokumentů, ale v této oblasti je nejpalčivější. Vlastně nejsme ani tak nároční, jak by se na první pohled mohlo zdát. Náš milovaný formát by měl mít tyto vlastnosti:

  • Jeho specifikace musí být známá a zdokumentovaná.
  • Měl by být dostatečně stabilní a neměnný.
  • Musí být svobodný a nikdo nesmí omezovat jeho použití.
  • Jeho implementace musí být bezproblémová.
  • Měl by ho podporovat každý velký kancelářský balík.

Na první pohled tedy velmi jednoduché požadavky, které by neměly činit problémy. Ale jak víme, ono to není tak jednoduché. Popíráme tím základní touhu po komunikaci. Co tedy máme k dispozici? Samozřejmě formátů obecně je celá řada, ale my se podíváme jen na ty nejznámější.

DOC

Pseudostandard hlavně na platformě MS Windows. Bohužel jeho specifikace není známá a Microsoft ji úzkostlivě tají. Navíc se už několikrát změnila a jistě se změní znovu. Výhodou je jeho podpora ve všech kancelářských balících. Sice mizerná, ale je. Bohužel to je jediný požadavek, který tento formát splňuje.

PDF

Formát firmy Adobe, který se velmi rozšířil především díky dobré dokumentaci a uvolněné specifikaci. Je ideální pro přenos souborů především díky široké podpoře a multiplatformnosti. Bohužel PDF můžeme označit za „koncový” formát, protože jeho následná úprava je bez zakoupení komerční aplikace problematická nebo přinejmenším nesnadná.

HTML

HTML je také svobodný a univerzální formát, o kterém můžeme říci, že jej podporují naprosto všechny platformy. Nevýhodou je snad jen fakt, že nedokáže zaručit výslednou podobu za všech okolností, jako je tomu u PDF. Pro běžný přenos dat je však vyhovující a dovoluje také bezproblémovou editaci.

XML

Do XML se vkládají velké naděje a časem by mohlo posloužit jako formát budoucnosti. Je otevřené, svobodné a jednoduše zpracovatelné. Jeho nevýhodou je ale velmi volná definice, takže je nutno nad ním vystavět další formát, který by byl závazným standardem pro přenos konkrétních dokumentů.

RTF

RTF je také velmi rozšířeným formátem. Jedná se o nebinární formát, který umožňuje ukádat i velmi komplikované formátování. Je velmi stabilní a podporuje jej drtivá většina textových editorů. Jeho jedinou nevýhodou je větší velikost, která obvykle dosahuje násobků velikosti jiných formátů.

Formát OOo

Nativní formát OpenOffice.org splňuje většinu požadavků na správný formát. De facto se jedná o XML, které je společně s ostatními soubory (například obrázky) komprimováno běžným kompresním algoritmem. Jedinou nevýhodou je zatím jeho omezená podpora v ostatních kancelářských balících. Nový formát pro OOo 2.0 byl ale přijat konsorciem OASIS a je pravděpodobné, že se stane ISO normou. To by znamenalo veliký posun v oblasti formátů souborů a snad by tento oficiální standard začala akceptovat většina firem.

V současné době je situace velmi nepřehledná a zmatená. Chcete-li si být jisti, že váš dokument otevře kdokoliv, musíte jej poslat v html. Pokud ale potřebujete zachovat jeho podobu, musíte sáhnout po PDF a doufat, že má uživatel nainstalován jeho prohlížeč. Univerzální a bezproblémový formát zatím nemáme. Každopádně nejrozumnější se zdá být RTF. Bohužel je nevýhodou jeho nepoměrně větší velikost proti ostatním formátům.

Otázkou ale zůstává, zda je tu vůle něco změnit. Microsoftu situace vyhovuje, ovládá formátový trh a buduje si svůj monopol. Běžní uživatelé jsou také spokojení, jim to nějak funguje, co na tom, že musejí používat konkrétní produkt? Buď ho už mají, nebo si ho ilegálně zkopírují.

Udělal jsem si malý průzkum pomocí Google, abych si ověřil, jak je to s jednotlivými formáty na Internetu. Je mi jasné, že to nejsou přesná čísla, ale šlo o to zjistit přibližný stav.

  • PDF – 70 milionů
  • DOC – 10 milionů
  • RTF – 1 milion

Výsledek je poměrně pozitivní. Situace je pro RTF poměrně nepříznivá, ale PDF je na tom mnohem lépe než DOC. Důležité každopádně je stále prosazovat některý ze svobodných formátů, aby si i běžný uživatel uvědomil, jak je jejich existence důležitá. Jedině tak jsme schopni zatlačit na firmy podporující uzavřené formáty, a tím můžeme něco změnit.

Ohromnou chybou by bylo přijmout názor „Nejrozumnější je DOC, protože ho jakž takž podporují všichni, a tak ho zatím budu používat taky.”. Přispěli bychom stagnaci, která panuje teď. Čím více se budeme sami snažit podpořit alternativní formáty, tím více o nich bude slyšet a tím dříve také nastane změna.

Anketa

Jaký formát dokumentů používáte nejčastěji?

Našli jste v článku chybu?

9. 5. 2005 23:28

Rozdíl mezi pojmy „otevřený” a „svobodný” je podle mě platný obecně u formátů i software jako takového. Otevřený je software nebo formát, ke kterému máme specifikaci. Takový ovšem nemusí být svobodný, někomu konkrétnímu patří a my jej nemůžeme modifikovat (například donedávna GIF a třeba závodní hra Racer).

Naproti tomu svobodný znamená, že máme specifikaci a můžeme tento kód či formát měnit, ale především nikomu nepatří a žádný subjekt se tedy nemůže rozhodnout jej zm…

9. 5. 2005 11:44

Běžní uživatelé jsou také spokojení, jim to nějak funguje...

Dovoluji si oponovat. Ono jim to často také nefunguje, jenže to považují za normální. Díky mediální masáži naprostá většina BFU považuje za normální, že neotevře Dokument vytvořený novější verzí téhož programu (vždyť chyba je na jejich straně - jsou přece dinosauři, nejsou in). Volba formátu při zápisu je daleko za představivostí lidí, kteří často ani nevědí, co je soubor, a kteří "ovládají" jen Word, Poštu (někteří dokonce vědí, k …

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Lupa.cz: Proč firmy málo chrání data? Chovají se logicky

Proč firmy málo chrání data? Chovají se logicky

Lupa.cz: Kdo pochopí vtip, může jít do ČT vyvíjet weby

Kdo pochopí vtip, může jít do ČT vyvíjet weby

DigiZone.cz: Test Philips 24PFS5231 s Bluetooth repro

Test Philips 24PFS5231 s Bluetooth repro

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Podnikatel.cz: EET: Totálně nezvládli metodologii projektu

EET: Totálně nezvládli metodologii projektu

Vitalia.cz: Když přijdete o oko, přijdete na rok o řidičák

Když přijdete o oko, přijdete na rok o řidičák

DigiZone.cz: Recenze Westworld: zavraždit a...

Recenze Westworld: zavraždit a...

Měšec.cz: mBank cenzuruje, zrušila mFórum

mBank cenzuruje, zrušila mFórum

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Vitalia.cz: 9 největších mýtů o mase

9 největších mýtů o mase

120na80.cz: Na ucho teplý, nebo studený obklad?

Na ucho teplý, nebo studený obklad?

Podnikatel.cz: Snížení DPH na 15 % se netýká všech

Snížení DPH na 15 % se netýká všech

120na80.cz: Co všechno ovlivňuje ženskou plodnost?

Co všechno ovlivňuje ženskou plodnost?

Podnikatel.cz: K EET. Štamgast už peníze na stole nenechá

K EET. Štamgast už peníze na stole nenechá

Root.cz: Certifikáty zadarmo jsou horší než za peníze?

Certifikáty zadarmo jsou horší než za peníze?

Lupa.cz: Propustili je z Avastu, už po nich sahá ESET

Propustili je z Avastu, už po nich sahá ESET

Podnikatel.cz: Chaos u EET pokračuje. Jsou tu další návrhy

Chaos u EET pokračuje. Jsou tu další návrhy

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

Vitalia.cz: Láska na vozíku: Přitažliví jsme pro tzv. pečovatelky

Láska na vozíku: Přitažliví jsme pro tzv. pečovatelky