Názory k článku Akta X: EXI čili binární XML

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

5. 11. 2007 0:27

.KELB (neregistrovaný)

jak se takovy binarni format da pouzit se systemy jako CVS nebo SUBVERSION. Ony totiz existuji programy u nichz je zadouci skladovat verze dokumentu (z hlavy me napada treba ulozeni elektronickeho schematu nejakeho zarizeni a jeho pozdejsi revize). Pouziti binarniho formatu by znamenalo upravu systemu pro spravu verzi. nebo se mylim?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 8:02

Tom (neregistrovaný)

Mylite se, CVS a SVN v pohode skladuji a porovnavaji binarni formaty ;-)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 15:32

anonymní

To sice jo, ale binarni diff neni zrovna moc human-readable ...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2007 10:01

martin (neregistrovaný)

Kompilátory jsou špatné, protože binárky se špatně skladují v CVS a Subversion, nejde na ně diff...

Pokud někdo chce skladovat XML dokumenty v nějakém verzovacím systému, asi si nevybere binární serializaci a jestli ano, je to jeho problém.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 3:04

Mr. Zdeeck (neregistrovaný)

Tak super, viditelne se ve W3C nepoucili z WBXML (Wireless Binary XML), coz je uplne otresny propadak, ale jeste navrch vymysleji EXI. Ja bych je kopal do zadku - nejlepsi binarni representace XML je gzip a hotovo. Implementace je tady 30 let, funguje to, je to ucine a hlavne se s tim nikdo nemusi delat znova. At si nekdo jen tak pro legraci zkusi naimplementovat prave WBXML (a neopisujte z libwbxml :-) a uvidi, jaka je to kravina.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 12:13

Makovec (neregistrovaný)

1. wbxml resi neco jineho nez gzip dokumentu
2. wbxml jsme implementovali, libwbxml neopisovali a jako kravina nam to neprislo...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 5:53

BLEK. (neregistrovaný)

"Dokument XML je modelován jako proud událostí, které jsou v daném kontextu reprezentovány různě dlouhými kódy ... Dále může být použita dodatečná komprese na principu náhrady často opakujících se vzorů"

--- na tohle přece mohli použít gzip. Proč kvůli tomu vymýšlet nový formát?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 8:33

MMN (neregistrovaný)

W3M totiž musí nějakou práci alespoň předstírat, aby se mezi sponzory nevyskytly pochybnosti o užitečnosti konsorcia.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 9:03

Vojtech Toman (neregistrovaný)

Snahy W3C maji perfektni smysl, ono to totiz s tim gzipem (a ani jinymi "general-purpose" kompresory) a XML neni zase tak skvele. Pokud vas zajima jenom redukce objemu dat, tak mozna (ale i tak se da ukazat, ze muzete komprimovat mnohem lepe, kdyz vite, ze komprimujete XML). Jakmile ale s komprimovanymi XML daty chcete pracovat, musite je rozbalit (bud vsechno, nebo po castech). To jednak neco stoji a jednak vas to pripravuje o flexibilitu pri zpracovavani XML obsahu. Naproti tomu, kdyz mate rozumny binarni XML format, muzete parsovat binarni data rovnou, bez nutnosti dekomprese ("binarni SAX"). Nektere binarni XML formaty vam dokonce dovoli vyhodnocovat urcite typy dotazu (XPath atd.) primo v binarni domene. Hlavni vyhoda binarniho XML ale spociva v tom, ze tim, ze pracujete primo s binarnimi daty, nejen ze odlehcite uloznemu/prenosovemu mediu (je nutne prenaset/ukladat mene bitu), ale take ziskate moznost rychlejsiho zpracovani dat (parser musi precist a analyzovat mensi pocet bitu)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 10:11

Bilbo (neregistrovaný)

Ale binarni XML bude taky mozny gzipovat a bzip2ovat a neco mista tak jeste usetrit :)
Jestli kompromovane binarni XML bude vetsi ci mensi nez obycejne je uz jina otazka...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 13:22

Jirka (neregistrovaný)

No to je otazka, jestli je to rychlejsi. Sice se musi v textovem formatu po sbernici prenaset vice dat, ale zase jednotky (procesory), ktere ta data zpracovavaji obvykle pracuji s celymi byty a prace po bitech je vyrazne pomalejsi.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2007 11:37

erg (neregistrovaný)

Nic ve zlem, ale vy jste asi nikdy neprogramoval na embedded zarizenich, ze? Popr. tam, kde musite minimalizovat toky dat za soucasneho zachovani jednoducheho zpracovani. Tady ma binarni XML ohromny potencial, soucasne textove XML je pro tyto ucely nepouzitelne - ohromne mnozstvi dat, velke naroky na zpracovani (cemz komprese ala gzip rozhodne prilis nepomaha). Osobne se tesim, az tohle bude uvedeno do praxe, misto toho, aby clovek musel pro kazdy pripad vymyslet format a kontejner pro data, tak bude moci pouzit standardni binarni XML, s spoustu nastroju (a knihoven) pro praci s nim.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 13:30

Jirka (neregistrovaný)

Jinak mas pravdu v tom, ze to neni k nicemu. General-purpose kompresory nejsou vhodne, pokud zkomprimovana data chceme rovnou nejak zpracovavat. To, ze se i pro tyto ucely hodi nejaky typ prefixoveho kodovani, neni objevovani kola (jak se tu snazi nekdo prosadit), ale proste pouziti znamych vlastnosti znameho algoritmu ve specifickem pripade.

Jiste, jsou aplikace, kde binarni XML nebude vhodne, napriklad tam, kde se da ocekavat, ze by si ho nekdy chtel precist a pozmenit nejaky clovek (treba konfiguracni soubory). Obecne je ale XML format pro vymenu dat mezi stroji a tem je obecne uplne jedno, jestli jsou data zachlivkovana do bytu nebo symboly maji promennou delku.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 16:45

BLEK. (neregistrovaný)

Ona je otázka, za jakým účelem se to binární XML vlastně dělá.

a) Pokud se dělá za účelem rychlého zpracování, tak je třeba zapomenout na nějaké Huffmanovy kódy a hledání opakujících-se řetězců, protože tyhle věci zpracovávání zpomalují, nezrychlují. Pak se taky udivuji, proč v článku píšou, že je to "stream" dat, asi by bylo rozumnější, aby to byl strom, aby se daly přeskakovat elementy, co člověk nechce. Další věc, co by zpracovávání mohlo zrychlit, by mohlo být třeba přidat ke každému řetězci 32-bitový hash, aby se nechtěné elementy a atributy daly přeskakovat rovnou jedním porovnáním, a nebylo třeba dělat pomalé porovnávání řetězců po bytech.

b) Pokud se dělá za účelem zmenšení velikosti dokumentu (z článku jsem získal dojem, že tohleto byl cíl autorů), pak mi přijde divné, že komise navrhuje něco, co v podstatě používá kompresní algoritmy ze 70 let. Kdyby vztali nějaký současný kompresní algoritmus a vyřešili v něm problémy, kvůli kterým to XML komprimuje neefektivně (např. použili odlišné slovníky a statistické tabulky pro elementy/atributy/data), tak mi přijde, že by tím mohli dosáhnout daleko lepších výsledků.

On i ten gzip (i když jeho princip je jednoduchý) se vyvíjel mnoho let, aby byl rychlý a efektivní, tak pochybuju, že pokud si někdo sedne a řekne "já teď udělám kompresi opakujících-se řetězců", tak výsledek bude lepší než gzip.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 11:20

YF (neregistrovaný)

bleku prosimti - kresli raci komiksy o svejch poruchach ...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 13:13

Clock (neregistrovaný)

Protoze sou vymlety? Jiny vysvetleni me nenapada. Kdyby predtim nez se sesedli k zelenemu stolu zadali par klicovych slov do vyhledavace, mohli prijit na to, ze binarni ekvivalent XML uz nekdo vymyslel. RFC je na to uz z roku 2004:

http://en.wikipedia.org/wiki/Extensible_Binary_Meta_Language
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 10:31

Programátor (neregistrovaný)

Kravaťácký "vynálezci" od XML právě vynalezli kompresi a Huffmanovo kódování. Blahopřejeme hoši!
Můžete se zase napakovat na konzultacích k vládním "projektům" a "informačním systémům" a lítat na EXI konference.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 11:18

YF (neregistrovaný)

:)) 1+
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 12:56

Jan Forman (neregistrovaný)

Nepříjdu si jako kravaťák, a XML používám všude... gzip na redukci objemu dat bohatě postačuje. Ve velkém informačním systému je to jediné možné čisté řešení (struktura dat je přesně definována, a změny v komponentech se nemusí řešit).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 13:09

Clock (neregistrovaný)

Me to XML prijde ze zadny problem neodstranuje. Namisto problemu "jaky vyznam ma binarni polozka na offsetu 13" tam je akorat 1:1 problem "jaky vyznam ma tag blabla". Takze problem struktury dat to neresi.

Zato to prinasi obrovskou nevyhodu, a to je zvyseni mnozstvi dat a zesloziteni parsovani. Co se driv veslo do bajtu potrebuje ted 1-3 bajty (dekadicky zapis), co driv do 2 bajtu potrebuje 1-5 atd. Co bylo na fixnim miste musi se hledat. Kde byl vyznam dany implicitne je ted dan explicitne tagem a to zabira spoustu mista navic.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 14:38

Jan Forman (neregistrovaný)

Jenže je to přenesitelné kamkoliv, stačí se domluvit s cizí firmou: data od nás lezou ve tvaru xxxxxxxxxxx a hotovo (API). Žádné další starosti, nic. Tohle je k nezaplacení a k tomu je to hlavně určeno. Já si bez něj aplikace neumím představit (protože po staru to byla pěkná prasárna, i když rychlejší).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 19:43

Biktop (neregistrovaný)

A v čem to co řeší? Podle mě to je k ničemu. Akorát další zbytečná věc do světa počítačů, na níž se někdo může napakovat.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2007 11:39

erg (neregistrovaný)

Az budete muset implementovat interoperabilitu mezi vasim SW a SW tretich stran nad dynamickymi daty (tzn. daty, ktere nemaji zrovna format sekvence fixnich struktur), tak to XML ocenite, verte mi :-)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 16:15

J (neregistrovaný)

Az na to, ze kdyz ti pridam do binarniho souboru byte do hlavicky, tak se ti vyznam polozky na offsetu 13 znacne zmeni. U XML bude mit tag "jmeno" vyznam stale stejny, bez ohledu na to, jestli je na pozici 1 nebo 10 (teda pokud nejsem dobytek, jako jeden z dodavatelu naseho IS, ktery s klidem zmeni XML format tak, ze je puvodni parsovani nepouzitelne).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 18:41

anonymní

To naprosto není pravda - nic takového jako je stejný význam tagu na různých pozicích nezaručuje. XML totiž žádný význam tagu neurčuje. Není vůbec problém, aby tak xy byl v programu interpretován jinak, než ten samý tag zanořený o jednu úroveň níže v tagu abc. Sice je to prasečina to takto dělat, ale XML tuhle možnost připouští.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2007 11:06

Dor (neregistrovaný)

A pak je tu ještě prasečina, kdy na stejné úrovni jsou dva stejně pojmenované tagy, ale jejich význam se liší podle pořadí. To asi myslel kolega předemnou. Např. když má z [uroven][x]pokus[/x][x]hokus[/x][/uroven] vylézt "pokus 1, hokus 2" (Hranaté závorky zaměn za špičaté.) To už je prasárna, kterou nepovoluje ani XML. (Teda aspoň doufám.)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 20:45

hisaak (neregistrovaný)

Podle me jste neco nepochopil. Dulezite je, ze s XML muzete mit jeden format pro vsechny mozne konfiguraky. Nemusite psat 100 parseru pro ruzne formaty, nemusite stokrat objevovat kolo. Kdo zna v tomto ohledu zmatek v /etc/, vi, o cem pisu. Navic pokud nejste pako jako inzenyri v microsoftu, tak ty vase konfiguraky muzou byt velmi pekne samopopisne, coz treba o takove crontabu tvrdit nelze. :-)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2007 10:04

Biktop (neregistrovaný)

Raději pochopím pár různých jednoduchých konfiguráků v /etc, než abych se učil XML. Soubory XML jsou člověkem mnohem hůře čitelné, než klasické konfiguráky. Takže jsou nakonec zpracovatelné stejně jen pomocí nějaké aplikace a nic se neřeší, spíš naopak - zbytečně komplikuje.
A napsat parser umí každý, kdo má základy výpočetní techniky. Kdo to neumí, ať jde raději prodávat fialky místo toho, aby vymýšlel kraviny.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2007 11:06

J (neregistrovaný)

To hodne zalezi na tom, jak moc velky dobytek je tvurce toho konfiguraku. Znam textove konfiguraky, ve kterych se nikdo jiny nez tvurce nevyzna a to pres to, ze 90% jejich obsahu jsou komentare a znam xml konfiguraky, kde zadne komentare nejsou a pres to je bez problemu pochopi i BFU.

Ale to je spis podruzna vec, pokud chci udelat klikaci konfigurator, ktery nerozbordeli rucne napsany konfigurak, tak to v pripade textoveho souboru je vpodstate nemozny. Vzdycky me potesi, kdyz si napisu vlastni okomentovany konfigurak pro nejaky GUI nastroj, nacez nasledne zmenim jedinou volbu a prijdu o veskere komentare.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 20:53

Sten (neregistrovaný)

Možná by to chtělo odhalit roušku tajemství zkratky XML: Extensible Markup Language. Přičemž to první slovo je strašně důležité a vlastně je důvodem, proč je XML tak ukecané. Do té doby žádná binární (a vlastně ani textová) data neumožňovala tak jednoduché rozšiřování při zachování zpětné kompatibility a míchání více různých formátů do sebe.

Pokud však chcete jednoduchá data, která se budou měnit s verzí aplikace a na zpětné kompatibilitě vám nezáleží, pak je použití XML zbytečné.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 13:36

Standa (neregistrovaný)

Budou nové formáty natolik kompatibilní s XML, aby existující aplicace používající libxml nevyžadovala výraznější zásah v případě její migrace na binární formát?

Pokud ano, rýsuje se možnost výrazného zrychlení aplikací, které tráví většinu svého času parsováním XML.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 18:44

anonymní

A kde by se to zrychlilo? Když mám binární proud dat, kde musím ještě rozpakovávat určitá data tak je otázkou, zda to skutečně bude rychlejší.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 15:37

Palo (neregistrovaný)

Precital som si vsetky prispevky a az na dva mam dojem ze tomu nikto nerozumie. Robil niekto z vas co tu pisete XML parser (a validator voci XSD vratane namespace)? Uvedomujete si ze binarne XML sluzi hlavne na to aby sa tento XML to Memory alebo XML to internal structure nemusel robit? A az ako dalsia vlastnost je ze je to mensie. O velkost tu primarne vobec nejde.
Cez kolko vrstiev obvykle prechadza XML od povedzme klienta az po databazu? Rozumiete niektorym principom Enterprise message bus?
Potom nam sem nieco mudre napiste. Iniciativa je fajn. Treba to dotiahnut do praktickych implementacii. V kazdom pripade to velmi zrychli komunikaciu.
Trochu som sa rozohnil ale ludia co trepu do veci ktorym nerozumeju ma hrozne vytacaju a este sa tvaria ze oni su prave ti mudry. Lebo ak si niekto mysli ze ludia co pobehuju okolo W3C nevedie o Huffmanovej transformacii tak mate velmi naivne predstavy o fungovani sveta hraniciace s navstevou psychologa.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 16:27

Programátor (neregistrovaný)

Máte pravdu, mě zase rozčilujou přechytralí fanoušci XML. Takové lidi je správné popíchnout.
Doufám že jste ten praser (u XML tomu odmítám říkat parser) nepsal v projektu nebo v grantu placeném z mých daní. A když už jsme u těch parserů pro stromové datové struktury, znáte Lisp?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 16:34

Palo (neregistrovaný)

Parser sme pisali v kamennej dobe XML. Potom ked sme ho chceli rozsirit tak sme presli radsej na standard (Xerces), aj ked bol pomalsi. Debatu XML vs. Lisp radsej znovu neotvarajme. Po zamene ( na < a ) na > je to skoro to iste, ale to berte len ako zartovnu poznamku ;-).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 17:27

BLEK. (neregistrovaný)

Já jsem z daní poplaníků České Republiky prodrbal 100 000 (za dvě konference). Absurdní na tom je, že kdybych ty peníze neprodrbal, tak by mě z university vyhodili za neaktivitu.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 23:35

Programátor (neregistrovaný)

Blekovi to odpouštím, je pro mě kultovní linuxový progiš a nerd par excellence. Ale kravatózní šepleď bych věšel na šibenici za ty jejich barevně sladěné kravaty.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 17:01

heh (neregistrovaný)

Mozna jsem vas uplne nepochopil, ale proc do toho zatahujete Enterprise service bus? Staci treba podmnozina - webove sluzby, ne?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 21:28

Palo (neregistrovaný)

Pretoze raz naparsovat to musite vzdy takze je jedno kedy. Nepredpokladam ze klient bude nieco na WS posielat v binary XML. Ale prave ked to XML prevliekate po buse hore dolu a ciastocne parsujete a ohmatavate na roznych miestach tak vtedy sa ta vyhoda prejavi.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 17:17

YF (neregistrovaný)

PALO! JA TI DRZIM PALCE! MYSLIM ZE BY SIS DNESKA MEL UDELAT RADOST A JIT SI KOUPIT NOVOU KRAVATU!
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 21:16

Palo (neregistrovaný)

Dik za radu, bol som si dat vycistit obleky.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 17:20

BLEK. (neregistrovaný)

Zrychlení zpracování XML zní rozumně, ale otázka je, proč se tam teda píše o bitových polích a opakujících-se řetězcích? To mi přijde, že ani samotní navrhovatelé neměli jasno, proč to dělají.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 18:20

Jan Bauer (neregistrovaný)

Clanek se mi nelibi, je znacne zkresleny a vzdy rikam, ze neni nad original.

Binary XML je skvele, uz se nemohu dockat az bude vsude podporovano. Samozrejme dojde opet ke snizeni vykonu, ale procesory jsou levnejsi, nez rychlejsi pripojeni k internetu a bude velmi pekne, az napriklad takovy xmlHttpRequest() probehne o 50% rychleji diky prenosu zkomprimovanych dat.

Nadruhou stranu muze byt problem, az zacnou firmy pozmenovat ona binarni data tak, aby je vetsina lidi nemohla pouzit - na obsfukaci jsou takovi ti praseci programatori primo spicky. Obcas se nevyznaji ani ve svem vlastnim kodu, natoz my po nich. Ukazkovy priklad mohou byt jmena a hodnoty formularovych prvku na strankach T-mobile.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 18:52

anonymní

Dobře navržené binární XML by byl skvělý počin. Ale důraz kladu na ta slova dobře navržené. A přiznám se, že (můj subjektivní názor po sledování výsledků W3C komise posledních x let) nevěřím ani za mák tomu, že W3C neudělá tu nejhorší prasečinu, co vůbec jde vymyslet.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 21:01

Sten (neregistrovaný)

Mě osobně se třeba líbí EBML z Matrosky (které je velmi rychlé a přitom úsporné - proč se vlastně nedostalo do Use Cases?), tak pokud se W3C podaří během parsování zachovat výkon, ale přidat možnost neznat DTD, tak tomu budu tleskat. Jinak bych zůstal u EBML.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2007 11:09

J (neregistrovaný)

Hmm, teda nevim jak vy, ale ja mam prohlizec podporujici gzip a pokud to je povoleno na serveru, tak se veskere prenosy komprimuji.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 18:48

anonymní

Problém je, že W3C se učí základy programování. To co my už máme za sebou, W3C teprve bude studovat později. Zatím asi kdosi objevil Huffmana a bitová pole - a tak to nadšení musí někde ventilovat. Naše smůla, že zároveň určují standardy. A to teprve bude radosti, až třeba W3C komise objeví Quicksort!!! To bude určitě nějaký další standard - XML formát optimalizovaný pro rychlé třídění dat.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 19:59

anonymní

Doporucil byste nejaky lepsi algoritmus, nez Huffmanuv?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 20:24

BLEK. (neregistrovaný)

Doporučil bych obyčejné 32-bitové číslo, zarovnané na hranici 4 bytů. (předpokládám, že XML komise ještě nedosahují takové výkonnosti, aby standartizovali DTD s víc jak 2^32 elementů :-)

Huffmanův kód není špatná věc, jen by člověk u každého algoritmu měl zvážit, zda v daném případě jsou výhody přinesené algoritmem větší než nevýhody. Vy si taky do poznámkového bloku nepíšete poznámky Huffmanovým kódem --- sice byste ušetřil nějaký papír a tuhu, ale ztratíte spoustu času, když to budete kódovat a pak po sobě luštit :)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 21:21

Palo (neregistrovaný)

Ale preco? Huffmanov algoritmus je efektivnejsi a nema 2^32 obmedzenie. Nakolko sa jedna o strojove spracovanie ziadne nevyhody to nema. Podla coho ineho by si chcel hodnotit algoritmus?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 21:48

BLEK. (neregistrovaný)

Huffmanův kód je efektivnější na zmenšení množeství dat, ale množství dat zde není úzké hrdlo --- úzké hrdlo je zátěž CPU. (gigabitový ethernet zaplácaný XML, které se rovnou stíhá parsovat? diskové pole čtoucí XML rovnou do parseru rychlostí 300 megabytů za sekundu? --- to si lze asi těžko představit)

Psal jsem HTML parser (nikoli XML) a funkce, co spotřebovala nejvíc času --- asi 30% --- dělala hledání atributů u tagů. Takže, kdybych chtěl navrhnout binární rychle-parsovatelné HTML, tak bych udělal:

- ukazatel na další atribut
- hash jména atributu (pokud to není atribut, co chceme, tak rovnou skočíme na další bez porovnávání jména)
- délka jména (memcmp je rychlejší než strcmp)
- jméno
- hodnota atributu, ukončená nulou (aby se pointer na ni dal rovnou předávat funkcím v C)

(v rozpoznávání tagů mi profiler kupodivu ani nezobrazoval moc stráveného času, důležité byly atributy)

Jak by tomu měl pomoct Huffmanův kód, si nedokážu představit.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 22:08

Palo (neregistrovaný)

Aka zataz CPU ked uz to bude rovno v memory like forme? Ale RAM to ustiha vzdy. Najpomalsia cast vypoctoveho systemu je stale disk. Siet a pamat je OK. Vacsina XML sa uklada az niekde na konci spracovania.
To ze ty si to nevies predstavit este neznamena ze je to zle. Podla testov ktore su spomenute v clanku prave tato metoda bola najrychlejsia. Nerozumies faktom?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 22:54

BLEK. (neregistrovaný)

A to chtějí používat tu kompresi po bitech už v paměťové formě?

Pomalost disku? Hardwarové pole zvládne 300 megabytů, ale nedokážu si představit program, který data touhle rychlostí bude nějak zpracovávat (kromě triviálních utilit typu "cp" --- ale i ty už jsou při těchhle rychlostech na hranici svých možností a konzmují skoro všechen procesorový čas).

Pomalost disku tkví hlavně v dlouhé době seeku, ta nejvíc zpomaluje aplikace. Pokud máme např. obyčejný disk do PC, tak má přenosovou rychlost 50MB/s a dobu seeku 8ms. Ale vmstat nám ukazuje pod zátěží přenosovou rychlost třeba pouze 10MB/s. To znamená, že ten disk 80% času seekuje a pouze 20% času čte. Pokud nějakou kompresí zmenšíme množství přenesených dat dvakrát, tak bude doba seeku pořád stejná, takže jsme si ve výsledku pomohli jen o 10% (a procesor jsme tou kompresí zatížili o několik stovek procent víc).

Ad ty benchmarky --- ty spíš ukazují programátorské schopnosti jednotlivých týmů, než kvalitu formátu a algoritmů. Kdyby někdo dal specifikace formátů nezávislým týmům a nechal je to reimplementovat, tak dostane benchmarky úplně jiné.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2007 4:34

Palo (neregistrovaný)

Dakujem za zahlbenie sa do problematiky diskov, ale tusite vobec na co sa ten format ma pouzivat? Databazu v tom nikto robit nebude.
Co sa tyka schopnosti, nech sa paci, mozete sa prejavit, napiste lepsi.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2007 17:35

BLEK. (neregistrovaný)

Tuším, že se používá na komunikaci mezi klientem a aplikačním servrem (ale ne, že bych to někdy psal). Právě proto se divím, proč se do něj snaží dostat kompresi.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2007 18:08

Palo (neregistrovaný)

A citali ste clanok? Ide o binarne XML aby sa nemuselo vzdy parsovat. Najrychlejsia implementacia pouziva mimo ine aj Huffmanovo kodovanie.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 23:06

xyzzy (neregistrovaný)

Schvalne si to zkuste. BLEK ma podle me naprostou pravdu.

Na rychlosti nacitani do pameti se o 50% kratsi delka (ktere se tak nejvys dosahne pres Huffmanovu kodovani) tolik neprojevi. Ale uspora pri parsovani by mohla dosahnout i stovek procent, pokud by bylo mozne okamzite (porovnanim) poznat tag/atribut a skocit na dalsi.

Dalsi faktor je kodovani. Aby si mohly aplikace predavat data, museji je zakodovat do XML. Pokud budou pouzivat vicemene primo in-memory format (ktery jen poskladaji do nejakeho bufferu), tento krok odpadne.

Ted nad tim tak premyslim, a kdyby nejaka aplikace chtela ve velkem binarnim XML jen neco zmenit, a pak ho zase ulozit, tak by Huffmanovo kodovani bylo velmi nevyhodne. Zbytek od te zmeny by se totiz musel bitove posunout (prinejmensim). V BLEKove formatu by se to delat nemuselo.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2007 4:26

Palo (neregistrovaný)

O com to tu pisete? Ved predsa nikto netvrdi ze v pamati to bude tiez v Huffmanovom kodovanim. To je serialova forma na prenos medzi systemami. A prave ta Huffmanova forma bola v testoch najrychlejsia.
Ja tu nemiemim polemizovat o Blackovom formate. Ten ma vobec nezaujima. Ak si myslite ze to zvladnete lepsie, W3C Vas iste rada vypocuje.
Ten format musi byt iba memory like aby bol multiplatformovy, multijazycny. Citali ste clanok, pripadne thread?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2007 10:10

Biktop (neregistrovaný)

Jinými slovy tu akorát dokazujete, že je to naprosto zbytečná kravina.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2007 22:22

YF (neregistrovaný)

myslim ze se zde jedna o nejaky druh konspirace pratele ... nechci byt prilis paranoidni ale to konsorcium je rizeno z jineho solarniho systemu!
zajimalo by me - kolik toho jeste hodla tento spolek podelat a jak moc toho xml snese aby ho vsichni opravdu nenavideli i kdyz pro nektere aplikace je proste vic nez vhodne
no - nezbyva nez verit!!!

Zasílat nově přidané názory e-mailem

Názory k článku Akta X: EXI čili binární XML

Dále u nás najdete

Před otevřením baru přišel lockdown. Místo drinků začal prodávat znalosti

EET není český výmysl. Zjistěte, kde za účtenku můžete vyhrát auto

Z evropského koláče chytrých telefonů ukusují Apple a Honor

Nový model OpenAI kóduje 15krát rychleji než jeho předchůdce

Notepad++ opravil chybu zneužívanou k šíření malware

Malware, ransomware a další online hrozby: Jak se liší?

Google Pixel 10a má plochý design a vylepšenou odolnost

Pojišťovny zneužívají lenosti svých klientů. Ti za to platí

Nedostatek vitaminu D se projeví nejen únavou

Český startup ukazuje, že na AI modelech lze vydělávat

AMD přichází se značkou Ryzen AI do segmentu stolních počítačů

Po rodičovské na pracák. V prvních měsících dostanete 19 269 Kč

Statistiky o ransomware, které jste asi neznali nebo si neuvědomili

Česko se přímo podílí na evropské strategii pro čipy

Irsko se po pauze znovu otevírá pro výstavbu datových center

Konflikt na Blízkém východě: informace pro turisty

Nervózní Microsoft začal v ČR žehlit Trumpův chaos

Na arytmii přišel díky hodinkám. Lékaři radí zkoušet tep pravidelně

Nedostatek vitaminu D se projeví únavou i špatnou náladou

Registrace cizinců podle JMHZV praxi