Na streamove parsovani textu s pravidelnou syntaxi je yacc/bison (pro C), ten se da snadno pouzit i na XML. No a kdyz mam slozite XML ze ktereho jen vyzobavam, tak na to jsou nejlepsi regularni vyrazy v rucne psanem kodu, jako v clanku od Tima Braye. Kdyz z techhle dvou pristupu zkusim udelat hybrid, tak to myslim nedopadne dobre.
Regulární výrazy pro čtení XML nejde obecně použít. Jakmile jsou v dokumentu např. CDATA sekce, komentáře, odkazy na entity apod. přestanou vám fungovat.
Pokud chcete jen něco vyzobávat jsou na to dost dobře použitelné pull-parsery, o kterých Petr psal. Dlouhou dobu byla jedna z mála rozšířených implementací jen XmlReader v .NETu, ale poslední verze libxml2 toto rozhraní převzaly. Takže se skutečně blýská na lepší časy.
Regulární výrazy bych na čtení XML opravdu nikomu nedoporučoval. Je to málo robustní řešení.
Regulární výrazy pro čtení XML nejde obecně použít. Jakmile jsou v dokumentu např. CDATA sekce, komentáře, odkazy na entity apod. přestanou vám fungovat.
Pokud chcete jen něco vyzobávat jsou na to dost dobře použitelné pull-parsery, o kterých Petr psal. Dlouhou dobu byla jedna z mála rozšířených implementací jen XmlReader v .NETu, ale poslední verze libxml2 toto rozhraní převzaly. Takže se skutečně blýská na lepší časy.
Regulární výrazy bych na čtení XML opravdu nikomu nedoporučoval. Je to málo robustní řešení.
Regulární výrazy pro čtení XML nejde obecně použít. Jakmile jsou v dokumentu např. CDATA sekce, komentáře, odkazy na entity apod. přestanou vám fungovat.
Pokud chcete jen něco vyzobávat jsou na to dost dobře použitelné pull-parsery, o kterých Petr psal. Dlouhou dobu byla jedna z mála rozšířených implementací jen XmlReader v .NETu, ale poslední verze libxml2 toto rozhraní převzaly. Takže se skutečně blýská na lepší časy.
Regulární výrazy bych na čtení XML opravdu nikomu nedoporučoval. Je to málo robustní řešení.