Názory k článku Akta X 0402

2. 3. 2004 11:16

Jirka Kosek (neregistrovaný)

Jen bych upřesnil, že různé národní znaky lze používat v názvech elementů i ve verzi XML 1.0. Standard XML 1.0 vyjmenovává poměrně široký rozsah znaků, který však s dalším vývojem Unicode zastaral. Ironicky shrnutý rozdíl mezi 1.0 a 1.1 jde popsat jednou větou: "XML 1.1 dokumenty můžeme vytvářet na mainframech IBM a názvy elmentů zapisovat v etiopštině."

Pro implementátory vidím největší v problém unicodové normalizaci textu (http://www.w3.org/TR/2004/REC-xml11-20040204/#sec-CharNorm). Pokud někdo píše parser v prostředí, které nemá dobrou podporu Unicode, je to docela pracná věc. To asi bude i důvod, proč Daniel V. zatím podporu XML 1.1 do libxml2 nepřidal -- musel by si normalizaci napsat sám nebo využít nějaké externí knihovny jako ICU.

Dále u nás najdete