Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Hlavní navigace

Názory k článku
Akta X 0402

Jirka Kosek
Jirka Kosek (neregistrovaný)
2. 3. 2004 11:16 Nový

České znaky v názvech elementů jde použít i v 1.0

celé vlákno

Jen bych upřesnil, že různé národní znaky lze používat v názvech elementů i ve verzi XML 1.0. Standard XML 1.0 vyjmenovává poměrně široký rozsah znaků, který však s dalším vývojem Unicode zastaral. Ironicky shrnutý rozdíl mezi 1.0 a 1.1 jde popsat jednou větou: "XML 1.1 dokumenty můžeme vytvářet na mainframech IBM a názvy elmentů zapisovat v etiopštině."

Pro implementátory vidím největší v problém unicodové normalizaci textu (http://www.w3.org/TR/2004/REC-xml11-20040204/#sec-CharNorm). Pokud někdo píše parser v prostředí, které nemá dobrou podporu Unicode, je to docela pracná věc. To asi bude i důvod, proč Daniel V. zatím podporu XML 1.1 do libxml2 nepřidal -- musel by si normalizaci napsat sám nebo využít nějaké externí knihovny jako ICU.

Zasílat nově přidané příspěvky e-mailem