Akta X 0309

Petr Cimprich 30. 9. 2003

Velké firmy chtějí binární verzi XML; je to rozumný požadavek, nebo útok na samu podstatu tohoto jazyka? Ve W3C se tomu rozhodli přijít na kloub. James Clark chce přinést novou kvalitu do editování XML v Emacsu. Pracovní skupiny W3C v průběhu září nešetřily novými dokumenty.

Příznivce mimozemských civilizací a pa(ra)vědních oborů musím zklamat. Toto je mírně komentovaný přehled některých událostí, které se během měsíce září seběhly kolem XML. A ještě varování. Pokud tento formát článku nenarazí na dostatečně tuhý odpor čtenářů, nelze vyloučit, že se bude opakovat.

Binární reprezentace XML

Diskuse o binárním kódování informací obsažených v dokumentech XML jsou stejně staré jako tento formát sám. O zavedení standardního binárního zápisu usilují hlavně velké firmy. Konsorcium W3C se nyní rozhodlo převzít aktivitu v této oblasti a na 24. až 26. září svolalo do kalifornské Santa Clary pracovní seminář (The W3C Workshop on Binary Interchange of XML Information Item Sets). Cílem je shrnutí současných konkrétních zkušeností s binární reprezentací XML a vyjasnění postojů zainteresovaných subjektů. Svá stanoviska a návrhy ohledně „binárního XML“ prezentovaly kromě jiných firmy IBM, Sun, Nokia, Microsoft, Canon, Oracle, Adobe a Software AG. Stanoviska (position papers) byla s předstihemzve­řejněna, o závěrech W3C z tohoto semináře zatím není nic známo.

Ve prospěch binární reprezentace se uvádějí dva hlavní důvody. Menší velikost přenášených souborů a jejich rychlejší načítání. Na tyto dva aspekty lze pohlížet odděleně a jejich řešení se mohou ubírat různými směry. Snadným a dostupným řešením problému velikosti je prostá komprimace textových souborů XML. Urychlení načítání by vyžadovalo zásadnější změmu přístupu – ukládání informací obsažených v dokumentu XML přímo do binárního proudu. Někdy se v této souvislosti mluví o předparsovaném XML. Příkladem takovéhoto přístupu je převod XML do abstraktní syntaxe ASN.1 a použití jejího binárního kódování.

Oba výše zmíněné důvody mají racionální opodstatnění. Existují dokonce experimenty s binárním kódováním, které měly dosáhnout významných zlepšení v obou ohledech. Pravdivost těchto tvrzení nikdo nezpochybňuje, panují však pochybnosti o relevanci obou hledisek pro skutečné, praktické aplikace. Velikost přenášeného textového HTML byla vždy v porovnání s grafikou, aplety a dalšími objekty celkem zanedbatelná. U XML a XHTML je to podobné. Zazipování několika nebo několika desítek kilobajtů kvůli šířce pásma dnes nikomu nestojí za námahu. Kdyby tomu bylo jinak, určitě by na to dynamický trh webového softwaru zareagoval. Pokud mohu soudit, přenos komprimovaných souborů se příliš nerozšířil ani na úrovni aplikací. Také rychlost načítání dokumentů není v drtivé většině případů nijak limitujícím faktorem. V praxi většinou parsování nezabírá významnou část celkové doby zpracování.

Má tedy smysl vymýšlet nový a pravděpodobně složitý standard? Kdo o něj má ve skutečnosti zájem? Rozhodně výrobci softwaru. Binární kódování jim umožní přidávat a prodávat nové funkce. A abychom nebyli nespravedliví, binární formát by mohl usnadnit expanzi XML na mobilní zařízení, kde hraje významnou roli jak velikost přenášených dat, tak nároky na omezené systémové prostředky. Zájem Nokie nebude tak docela náhodný. Tak či onak, W3C bude muset pod tlakem svých významných členů dojít k nějakému závěru. Můj osobní odhad je, že se dříve nebo později binární reprezentace XML z dílny W3C dočkáme.

Nový editor XML pro Emacs

James Clark zveřejnil alfa verzinXML, nového módu pro editování dokumentů XML v oblíbeném editoru GNU Emacs. Novinkou je kontextová validace editovaných dokumentů oproti schématu Relax NG. Současné módy buď validují podle zastaralého DTD (psgml), nebo se specializují pouze na vybrané aplikace XML (xslice – XSLT, XSL-FO). Navzdory deklarované alfa verzi je již nXML dostatečně stabilní pro běžnou práci a poskytuje obvyklé funkce, jako je vizuální zvýrazňování či validace v reálném čase. Vzhledem k nesporné kvalitě dosavadních Clarkových projektů (např. Jade, XT, Expat, nebo také XSLT 1.0 a Relax NG) se všichni, kdo editujeme XML v Emacsu, máme na co těšit.

Specifikace

5. září pracovní skupina W3C pro RDF (RDF Core Working Group) představila šest nových verzí svých pracovních dokumentů. Jedná se o novou generaci specifikací RDF, které by měly doplnit a nahradit platné doporučení W3C z roku 1999. Dokumenty již jsou v pokročilém stádiu standardizačního procesu; aktuální verze zohledňují připomínky vznesené během období poslední výzvy (Last Call). Změny nejsou nijak zásadní; sem tam přibyl či ubyl atribut, příklad nebo byla upřesněna formulace. Zde je přehled aktuálních dokumentů:

Jen o týden později jiná pracovní skupina, XML Linking Working Group, uvedla jako svou poznámku návrh syntaxe identifikátorů fragmentů pro XML. Identifikátor fragmentu (tedy část URL za znakem #) syntakticky vychází z rámce XPointer Framework a schématu XPointer element(). Tento přístup umožňuje vcelku flexibilní a intuitivní adresování na úrovni elementů. Posuďte sami:

doc.xml#Title – element s ID Title, zkrácená verze – obdoba fragmentů v HTML.
doc.xml#elemen­t(Title) – totéž v plné notaci.
doc.xml#elemen­t(/1/3/2) – druhé dítě třetího dítěte prvního elementu na nejvyšší úrovni.
doc.xml#elemen­t(Title/4) – čtvrté dítě elementu s ID Title.

Ohodnoťte jako ve škole:

Průměrná známka 3,04

Našli jste v článku chybu?
Zasílat nově přidané příspěvky e-mailem
Vitalia.cz: Fuck you, rakovino

Fuck you, rakovino

Podnikatel.cz: Jste pojištěnec VZP? Stahujte u nás přehled

Jste pojištěnec VZP? Stahujte u nás přehled

Měšec.cz: Bič na šmejdy: bezplatná mediace

Bič na šmejdy: bezplatná mediace

120na80.cz: V zákulisí farmafirmy: růžový, ale i bílý Ibalgin

V zákulisí farmafirmy: růžový, ale i bílý Ibalgin

Podnikatel.cz: Nechtějí vrátit odpočet DPH? Chtějte úrok

Nechtějí vrátit odpočet DPH? Chtějte úrok

Měšec.cz: Vše o dani z nemovitých věcí

Vše o dani z nemovitých věcí

Vitalia.cz: Ministerstvo: Palmový olej nezakážeme, není důvod

Ministerstvo: Palmový olej nezakážeme, není důvod

Root.cz: Orange Pi Plus: malý počítač s Wi-Fi a SATA

Orange Pi Plus: malý počítač s Wi-Fi a SATA

Root.cz: Tails: superbezpečný systém nejen pro Snowdena

Tails: superbezpečný systém nejen pro Snowdena

Root.cz: EU chce zrušit anonymní platby

EU chce zrušit anonymní platby

Podnikatel.cz: Registr všech účtů. Konec daňovým únikům?

Registr všech účtů. Konec daňovým únikům?

Vitalia.cz: Čínská medicína: Citron při chřipce ne

Čínská medicína: Citron při chřipce ne

Měšec.cz: Velký jističový podfuk

Velký jističový podfuk

Vitalia.cz: Incest: Tabu nad jiné

Incest: Tabu nad jiné

Podnikatel.cz: Nové lejstro k doložení životního pojištění

Nové lejstro k doložení životního pojištění

Lupa.cz: Jak hackovat banky? Útočníci mají nový trik

Jak hackovat banky? Útočníci mají nový trik

Lupa.cz: Osmý plán na stavbu rychlých sítí je nedodělek

Osmý plán na stavbu rychlých sítí je nedodělek

Podnikatel.cz: Není jim to, tak to vrátí. Víme, jak na ně

Není jim to, tak to vrátí. Víme, jak na ně

Vitalia.cz: Pro otrlé: 42 obrázků, které budou na cigaretách

Pro otrlé: 42 obrázků, které budou na cigaretách

Vitalia.cz: Můj sýrový život

Můj sýrový život

Ušetřete