Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia Tuesday TopDrive KupDnes Navrcholu Bomba NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Hlavní navigace

Porovnání uložení dat v Open XML a ODF

Na MSDN blogu se objevilo zajímavé srovnání formátů ODF a Open XML, zaměřené na velikost výsledných dat a tedy i náročnost jejich následného zpracování. Do tabulkových procesorů byl naimportován poměrně velký balík dat z CSV a byl porovnán výsledek. Použity byly aktuální verze programů Excel 2007 a OpenOffice Calc 2.2. V Open XML měl výsledný soubor 1,5 MB, zatímco v ODF jen 1 MB. Po dekompresi mají ovšem samotná data v ODF 22 MB, zatímco Open XML je uložil jen do 8 MB souboru. Výsledek je přikládán především krátkým názvům elementů v Open XML.

Předchozí zprávička Následující zprávička        
Voty
Voty (neregistrovaný)
25. 4. 2007 9:49 Nový

Srovnani

celé vlákno
Autor v blogu jeste vyslovil domenku, ze je to diky rozdilne urovni komprese, takze jsem to zkusil rozbalit a sbalit v mc pomoci gzip a bz2 (stejna nastaveni komprese), zde jsou vysledky:

968K ODF.tar.gz
1,2M OpenXML.tar.gz

528K ODF.tar.bz2
844K OpenXML.tar.bz2

ODF se tedy skutecne zda byti komprimovatelnejsi nezli OpenXML. Alespon v tomto pripade.
uživatel si přál zůstat v anonymitě
25. 4. 2007 10:10 Nový

Re: Srovnani

celé vlákno
OpenXML asi obsahuje vice informaci at uz jsou potreba ci nikoli, nebo ne, oproti tomu ODF ma delsi popisky.

V pameti textoveho procesoru se ale ukladaji data v binarni podobe, tedy pouze informace, nehlede jak dlouhe byli popisky v XML, proto se domnivam, ze pri ukladani celeho stromu v binarni podobe bude mene zabirat ODF.

Samozrejme ta komprimovana velikost muze byt zpusobena jinym rozlozenim dat, ale to jsou spise nahodne faktory a moc bych na ne nesazel.
uživatel si přál zůstat v anonymitě
25. 4. 2007 10:27 Nový

Re: Srovnani

celé vlákno
Pak je otazka, o kolik je rychlejsi zparsovat pomoci nejaky XSLT XML dokument o velikosti 8MB nez 22MB. Ale to snad o moc dele trvat nebude, kdyz transformacni softy jsou optimalizovane na zpracovani XML a transformace XML do nejakyho binarniho stromu tak narocna snad neni.

Jinak ty body dobre shrnul v tom komentari vlko, nejlepsi je argument, ze OpenXML ma kratke nazvy tagu-a kdyz rekne, co znamena tag "c"?:) Osobne taky preferuju XML s dlouhyma tagama (samozrejme, jen u kterych je to nutne), ktery o sobe maji nejakou vypovidaci hodnotu.
uživatel si přál zůstat v anonymitě
25. 4. 2007 11:40 Nový

Re: Srovnani

celé vlákno
Microsoft ovšem argumentuje tím, že Open XML stejně nebude nikdy číst člověk, ale je navržené tak, aby se co nejlépe četlo počitači.
hisaak
hisaak (neregistrovaný)
25. 4. 2007 12:01 Nový

Re: Srovnani

celé vlákno
Jo a 640 kB bude stacit kazdemu.
Martin Hassman
25. 4. 2007 14:35 Nový

Reakce

celé vlákno
Zasílat nově přidané příspěvky e-mailem        

Přehled názorů

Srovnani
Voty 25. 4. 2007 09:49
└ 
Re: Srovnani
anonymní uživatel 25. 4. 2007 10:10
 
└ 
Re: Srovnani
anonymní uživatel 25. 4. 2007 10:27
 
 
└ 
Re: Srovnani
anonymní uživatel 25. 4. 2007 11:40
 
 
 
└ 
Re: Srovnani
hisaak 25. 4. 2007 12:01
Reakce
Martin Hassman 25. 4. 2007 14:35