Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Hlavní navigace

Akta X: EXI čili binární XML

Už čtvrtým rokem pokračuje úsilí W3C zaměřené na možnost binární serializace XML. Konsorcium nejprve důkladně zvažovalo, zda se vůbec do standardizace takového formátu pustit. Poté porovnávalo existující technologie a nakonec opravdu došlo na tvorbu nového standardu. Ta se teď pomalu chýlí ke konci.

Tweetni to Twitter Jaggni to! Jagg Del.icio.us Delicious

Takzvané binární XML, před dvěma, třemi lety vášnivě diskutované téma, se pomalu a vcelku nenápadně stává skutečností. Uprostřed letní okurkové sezóny pracovní skupina EXI konsorcia W3C představila první pracovní verzi dokumentu Efficient XML Interchange (EXI) Format 1.0. Podle plánu by ještě do konce roku nová specifikace měla přejít do víceméně stabilní fáze zvané Last Call.

W3C přitom v případě „binární XML“ postupuje nanejvýš obezřetně a důkladně. A až úsměvně důsledně se vyhýbá slovnímu spojení binární XML, na které mnozí veteráni značkovacích jazyků reagují jako býk na červený hadr. Jako první krok W3C ustanovilo pracovní skupinu XBC (XML Binary Characterization), jejímž úkolem bylo shromáždit informace, vyhodnotit případové studie a popsat z nich vyplývající vlastnosti a požadavky na případný binární formát. Důležitým požadavkem bylo, aby ony vlastnosti byly měřitelné. Dalším cílem XBC totiž bylo definovat pro vybrané vlastnosti metody měření, aby bylo možné co nejobjektivněji porovnat stávající nestandardní binární formáty pro serializaci XML.

Pracovní skupina XBC měla na svou práci vyhrazen přesně rok – od března 2004 do března 2005. Za tu dobu stačila publikovat čtyři dokumenty:

Svůj úkol pracovní skupina XBC beze zbytku splnila a připravila tím půdu pro další postup. Rok pilné práce přinesl zásadní argumenty do diskuze o užitečnosti či škodlivosti binární serializace. Odborná veřejnost v převážné většině přijala stanovisko XBC, že je možné a vhodné pokusit se o vytvoření univerzálního binárního formátu pro serializaci XML Infosetu. Že tento formát mnohým prospěje a nikomu neuškodí. Mimochodem, v červnu 2005 předseda XBC Robin Berjon přijal naše pozvání, aby o aktivitách a závěrech XBC promluvil na prvním ročníku konference XML Prague.

K pokračování práce započaté XBC byla v listopadu 2005 založena nová pracovní skupina EXI. Její činnost byla původně naplánována na dva roky do prosince 2007, ale nyní je jasné, že bude muset být o něco prodloužena. Konečným cílem EXI už je vytvoření specifikace formátu, který umožní efektivní serializaci XML Infosetu.

Pracovní skupina EXI se hned pustila do měření a porovnání existujících formátů podle kritérií připravených XBC. Soupeřily spolu tyto formáty: X.694 ASN.1/PER, Xebu, XSBC, FXDI, Fast Infoset, Efficient XML a esXML. Měření je podrobně popsáno v dokumentu Efficient XML Interchange Measurements Note; zde jsou výsledky měření. Nejlépe ze všech kandidátů si vcelku přesvědčivě vedl formát Efficient XML navržený firmou AgileDelta, který tak byl vybrán jako základ pro budoucí standardní formát EXI.

Formát EXI je založen na poměrně jednoduchém algoritmu. Dokument XML je modelován jako proud událostí, které jsou v daném kontextu reprezentovány různě dlouhými kódy. Na základě znalosti gramatiky jsou těm nejpravděpodob­nějším událostem přířazeny nejkratší kódy. Každý kód se skládá z nejvýše tří celých čísel bez znaménka, přičemž ke kódování každého celého čísla je použit minimální počet bitů nutný k rozlišení všech možných čísel na této úrovni. Dále může být použita dodatečná komprese na principu náhrady často opakujících se vzorů, některé textové řetězce (URI, prefixy, jména elementů) mohou být nahrazeny kompaktními identifikátory odkazujícími do tabulky řetězců, a podobně.

Stejný algoritmus se používá pro dokumenty bez schématu i pro ty, u nichž je k dispozici schéma. Liší se pouze použitá gramatika. Dokument bez schématu je zakódován podle základní gramatiky XML definované specifikací XML 1.0. Dokument se schématem je zákodován podle specifičtější gramatiky určené konkrétním schématem.

TIB2012

       

Formát EXI by měl dobře spolupracovat s existujícími standardy XML. Každý dokument EXI začíná bity 1 a 0, což je sekvence, na kterou nesmí začínat textové dokumenty XML v žádném z obvyklých kódování. Technicky tedy nic nebude bránit napsání parseru, který by uměl interpretovat jak XML, tak EXI. Obdobně na opačném konci zpracování se o vše může postarat serializér.

Dlouho kontroverzní binární XML se tak už brzy stane realitou. O tom, jaká bude skutečná odezva implementátorů a uživatelů, zatím můžeme jen spekulovat.

Školení: Pokročilejší kurz jazyka Java

Java je multiplatformní programovací jazyk, který vytvořila a vyvíjí společnost Sun. Java je silný, objektově orientovaný jazyk se širokou komunitou, nabízející především vysokou produktivitu vývoje.

  • Práce s řetězci
  • Regulární výrazy
  • Kolekce
  • Generiky
  • Smyčka typu "for" ve verzi Java 1.5
  • Výčty
  • Vlákna, synchronizace
  • Polymorfismus, RTTI
  • Java Beany
  • JDBC (práce s databázemi)
  • GUI (knihovny AWT a Swing)
  • Java na serveru (servlety, JSP)

Podrobnější informace a přihláška

Ohodnoťte jako ve škole:
Průměrná známka 2,88

Přehled názorů

kua su prvni a moc by me zajimalo
.KELB 5. 11. 2007 00:27
Nový
├ 
Re: kua su prvni a moc by me zajimalo
Tom 5. 11. 2007 08:02
Nový
│
└ 
Re: kua su prvni a moc by me zajimalo
anonymní uživatel 5. 11. 2007 15:32
Nový
└ 
Re: kua su prvni a moc by me zajimalo
martin 6. 11. 2007 10:01
Nový
Bullshit
Mr. Zdeeck 5. 11. 2007 03:04
Nový
└ 
Re: Bullshit
Makovec 5. 11. 2007 12:13
Nový
gzip
BLEK. 5. 11. 2007 05:53
Nový
├ 
Re: gzip
MMN 5. 11. 2007 08:33
Nový
├ 
Re: gzip
Vojtech Toman 5. 11. 2007 09:03
Nový
│
├ 
Re: gzip
Bilbo 5. 11. 2007 10:11
Nový
│
├ 
Re: gzip
Jirka 5. 11. 2007 13:22
Nový
│
│
└ 
Re: gzip
erg 7. 11. 2007 11:37
Nový
│
├ 
Re: gzip
Jirka 5. 11. 2007 13:30
Nový
│
└ 
Re: gzip
BLEK. 5. 11. 2007 16:45
Nový
├ 
Re: gzip
YF 5. 11. 2007 11:20
Nový
└ 
Re: gzip
Clock 5. 11. 2007 13:13
Nový
XML je trapné a pro smích
Programátor 5. 11. 2007 10:31
Nový
├ 
Re: XML je trapné a pro smích
YF 5. 11. 2007 11:18
Nový
└ 
Re: XML je trapné a pro smích
Jan Forman 5. 11. 2007 12:56
Nový
 
└ 
Re: XML je trapné a pro smích
Clock 5. 11. 2007 13:09
Nový
 
 
├ 
Re: XML je trapné a pro smích
Jan Forman 5. 11. 2007 14:38
Nový
 
 
│
└ 
Re: XML je trapné a pro smích
Biktop 5. 11. 2007 19:43
Nový
 
 
│
 
└ 
Re: XML je trapné a pro smích
erg 7. 11. 2007 11:39
Nový
 
 
├ 
Re: XML je trapné a pro smích
J 5. 11. 2007 16:15
Nový
 
 
│
└ 
Re: XML je trapné a pro smích
anonymní uživatel 5. 11. 2007 18:41
Nový
 
 
│
 
└ 
Re: XML je trapné a pro smích
Dor 6. 11. 2007 11:06
Nový
 
 
├ 
Re: XML je trapné a pro smích
hisaak 5. 11. 2007 20:45
Nový
 
 
│
└ 
Re: XML je trapné a pro smích
Biktop 6. 11. 2007 10:04
Nový
 
 
│
 
└ 
Re: XML je trapné a pro smích
J 6. 11. 2007 11:06
Nový
 
 
└ 
Re: XML je trapné a pro smích
Sten 5. 11. 2007 20:53
Nový
libxml
Standa 5. 11. 2007 13:36
Nový
└ 
Re: libxml
anonymní uživatel 5. 11. 2007 18:44
Nový
Naivita
Palo 5. 11. 2007 15:37
Nový
├ 
Re: Naivita
Programátor 5. 11. 2007 16:27
Nový
│
├ 
Re: Naivita
Palo 5. 11. 2007 16:34
Nový
│
└ 
daně
BLEK. 5. 11. 2007 17:27
Nový
│
 
└ 
Re: daně
Programátor 5. 11. 2007 23:35
Nový
├ 
Re: Naivita
heh 5. 11. 2007 17:01
Nový
│
└ 
Re: Naivita
Palo 5. 11. 2007 21:28
Nový
├ 
Re: Naivita
YF 5. 11. 2007 17:17
Nový
│
└ 
Re: Naivita
Palo 5. 11. 2007 21:16
Nový
└ 
Re: Naivita
BLEK. 5. 11. 2007 17:20
Nový
 
├ 
Uz se na binary XML tesim a novinek ocekavam vice
Jan Bauer 5. 11. 2007 18:20
Nový
 
│
├ 
Re: Uz se na binary XML tesim a novinek ocekavam vice
anonymní uživatel 5. 11. 2007 18:52
Nový
 
│
│
└ 
Re: Uz se na binary XML tesim a novinek ocekavam vice
Sten 5. 11. 2007 21:01
Nový
 
│
└ 
Re: Uz se na binary XML tesim a novinek ocekavam vice
J 6. 11. 2007 11:09
Nový
 
└ 
Re: Naivita
anonymní uživatel 5. 11. 2007 18:48
Nový
 
 
└ 
Re: Naivita
anonymní uživatel 5. 11. 2007 19:59
Nový
 
 
 
└ 
Re: Naivita
BLEK. 5. 11. 2007 20:24
Nový
 
 
 
 
└ 
Re: Naivita
Palo 5. 11. 2007 21:21
Nový
 
 
 
 
 
└ 
Re: Naivita
BLEK. 5. 11. 2007 21:48
Nový
 
 
 
 
 
 
└ 
Re: Naivita
Palo 5. 11. 2007 22:08
Nový
 
 
 
 
 
 
 
├ 
Re: Naivita
BLEK. 5. 11. 2007 22:54
Nový
 
 
 
 
 
 
 
│
└ 
Re: Naivita
Palo 6. 11. 2007 04:34
Nový
 
 
 
 
 
 
 
│
 
└ 
Re: Naivita
BLEK. 6. 11. 2007 17:35
Nový
 
 
 
 
 
 
 
│
 
 
└ 
Re: Naivita
Palo 6. 11. 2007 18:08
Nový
 
 
 
 
 
 
 
└ 
Re: Naivita
xyzzy 5. 11. 2007 23:06
Nový
 
 
 
 
 
 
 
 
└ 
Re: Naivita
Palo 6. 11. 2007 04:26
Nový
 
 
 
 
 
 
 
 
 
└ 
Re: Naivita
Biktop 6. 11. 2007 10:10
Nový
chce w3c znicit pocitace?
YF 5. 11. 2007 22:22
Nový
       

Tento text je již více než dva měsíce starý. Chcete-li na něj reagovat v diskusi, pravděpodobně vám již nikdo neodpoví. Pro řešení aktuálních problémů doporučujeme využít naše diskusní fórum.

Zasílat nově přidané příspěvky e-mailem