Tuším vaší motivaci, ale mám asi jiný názor na to, k čemu používat XML, proto si asi nerozumíme.
Co se stane, když přenesete naparsované binární XML po síti, nehrozí že se poškodí (nebo ho někdo záměrně poškodí) a vy si toho nevšimnete, protože ho nebudete znovu validovat? Nebo budete počítat kontrolní součty? To je ale taky další zátěž procesoru, možná menší než vlastní parsování, ale efekt se tím značně snižuje.
XML vidím jako prostředek pro přenosy malých objemů složitě strukturovaných dat. Zajímavé jsou také XML databáze (ty bych ale nejraději viděl jako transparentní mapování relačních tabulek na XML struktury).
Jestli chce ale někdo pomocí XML nahrazovat databáze nebo přenášet gigabajty, tak ať se klidně pachtí s nějakým binárním xml, je to jeho problém. Já to ale považuji za ztrátu času.
1) Mám knihu jejíž zdroják v TeXu má asi 500 kB a má to přes 350 stran. Jaké XHTML bude mít 10MB? Vzhledem k tomu, že je to xhtml tak je možné, že to budu stahovat po síti. Proč bych měl stahovat 10 MB, když mne zajímá třeba jen hlavička, nebo první stránka??? Jak jsem tu už někde psal: nebudu posílat/přijímat data, která nepotřebuju.
Možné je, že jsi do těch 10 MB chtěl nacpat i obrázky, ale to mi přijde jako extra zhovadilost. Jednak ne každý ty obrázky chce a jednak není dobré nahrazovat souborový systém nějakým formátem a cpát to všechno do jendoho souboru*
2) K CSV - jestli to funguje a funguje to dobře a navíc je to přehledné, tak proč do toho šťourat?
22.08.2006 #162
země|měna|množství|kód|kurz
Austrálie|dolar|1|AUD|16,761
Bulharsko|lev|1|BGN|14,400
Čína|renmin bi|1|CNY|2,759
Dánsko|koruna|1|DKK|3,775
Myslíš, že tohle bude v XML přehlednější? Akorát tam přibydou desítky menšítek a většítek a textu bude asi 2x tolik. XML je skvělá věc, ale je zbytečné ho používat na takto jednoduchá data.
*) Často mne např. štve, že musím čekat na rozbalení celého tar.gz souboru, přestože se chci jen podívat, jaké soubory obsahuje. U zipu to vidím hned, ale u 10 MB tar.gz to trvá citelné déle.