Autor v blogu jeste vyslovil domenku, ze je to diky rozdilne urovni komprese, takze jsem to zkusil rozbalit a sbalit v mc pomoci gzip a bz2 (stejna nastaveni komprese), zde jsou vysledky:
968K ODF.tar.gz
1,2M OpenXML.tar.gz
528K ODF.tar.bz2
844K OpenXML.tar.bz2
ODF se tedy skutecne zda byti komprimovatelnejsi nezli OpenXML. Alespon v tomto pripade.
Porovnání uložení dat v Open XML a ODF
25. 4. 2007 8:52
Petr Krčmář
Na MSDN blogu se objevilo zajímavé srovnání formátů ODF a Open XML, zaměřené na velikost výsledných dat a tedy i náročnost jejich následného zpracování. Do tabulkových procesorů byl naimportován poměrně velký balík dat z CSV a byl porovnán výsledek. Použity byly aktuální verze programů Excel 2007 a OpenOffice Calc 2.2. V Open XML měl výsledný soubor 1,5 MB, zatímco v ODF jen 1 MB. Po dekompresi mají ovšem samotná data v ODF 22 MB, zatímco Open XML je uložil jen do 8 MB souboru. Výsledek je přikládán především krátkým názvům elementů v Open XML.
Dále čtěte…
- Google uvolnil informace o požadavcích na odstranění obsahu 28. 5. 2012 14:47
- Firefox na Windows 8 s ARM? Microsoft říká NE! 10. 5. 2012 13:09
- OneNote od Microsoftu dorazilo na OS Android 10. 2. 2012 15:03
- Microsoft představil nový souborový systém ReFS 18. 1. 2012 14:07
- IPv6 obsah bude globálně spuštěn 6. června 2012 18. 1. 2012 11:09
uživatel si přál zůstat v anonymitě
25. 4. 2007 10:10
Nový
Re: Srovnani
celé vlákno
OpenXML asi obsahuje vice informaci at uz jsou potreba ci nikoli, nebo ne, oproti tomu ODF ma delsi popisky.
V pameti textoveho procesoru se ale ukladaji data v binarni podobe, tedy pouze informace, nehlede jak dlouhe byli popisky v XML, proto se domnivam, ze pri ukladani celeho stromu v binarni podobe bude mene zabirat ODF.
Samozrejme ta komprimovana velikost muze byt zpusobena jinym rozlozenim dat, ale to jsou spise nahodne faktory a moc bych na ne nesazel.
V pameti textoveho procesoru se ale ukladaji data v binarni podobe, tedy pouze informace, nehlede jak dlouhe byli popisky v XML, proto se domnivam, ze pri ukladani celeho stromu v binarni podobe bude mene zabirat ODF.
Samozrejme ta komprimovana velikost muze byt zpusobena jinym rozlozenim dat, ale to jsou spise nahodne faktory a moc bych na ne nesazel.
uživatel si přál zůstat v anonymitě
25. 4. 2007 10:27
Nový
Re: Srovnani
celé vlákno
Pak je otazka, o kolik je rychlejsi zparsovat pomoci nejaky XSLT XML dokument o velikosti 8MB nez 22MB. Ale to snad o moc dele trvat nebude, kdyz transformacni softy jsou optimalizovane na zpracovani XML a transformace XML do nejakyho binarniho stromu tak narocna snad neni.
Jinak ty body dobre shrnul v tom komentari vlko, nejlepsi je argument, ze OpenXML ma kratke nazvy tagu-a kdyz rekne, co znamena tag "c"?:) Osobne taky preferuju XML s dlouhyma tagama (samozrejme, jen u kterych je to nutne), ktery o sobe maji nejakou vypovidaci hodnotu.
Jinak ty body dobre shrnul v tom komentari vlko, nejlepsi je argument, ze OpenXML ma kratke nazvy tagu-a kdyz rekne, co znamena tag "c"?:) Osobne taky preferuju XML s dlouhyma tagama (samozrejme, jen u kterych je to nutne), ktery o sobe maji nejakou vypovidaci hodnotu.
uživatel si přál zůstat v anonymitě
25. 4. 2007 11:40
Nový
Re: Srovnani
celé vlákno
Microsoft ovšem argumentuje tím, že Open XML stejně nebude nikdy číst člověk, ale je navržené tak, aby se co nejlépe četlo počitači.
hisaak (neregistrovaný)
25. 4. 2007 12:01
Nový
Re: Srovnani
celé vlákno
Jo a 640 kB bude stacit kazdemu.
25. 4. 2007 14:35
Nový
Reakce
celé vlákno
Prikladam odkaz na zajimavou reakci OT: Reakcia na clanok "Optimalizace uložení dat v Open XML"

