Vlákno názorů k článku Proč XML není jen bublina od Aznoh - RE: internacionalizace To neni tak docela pravda: XML sice...

Článek je starý, nové názory již nelze přidávat.

17. 4. 2003 9:50

Aznoh (neregistrovaný)

RE: internacionalizace

To neni tak docela pravda: XML sice obsahuje informaci v jake kodove strance je napsano, ale bohuzel uz napsanou v nejake kodove strance.. tzn. neexistuje zpusob jak zjistit kodovou stranku jeste pred ctenim dokumentu. Nehlede na neexistenci moznosti zapsat cast dokumentu v jine kodove strance.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 4. 2003 9:58

zoul (neregistrovaný)

A cast dokumentu v jine kodove strance bych chtel psat proc? To by ze me parsery asi definitivne zcvokly.

T.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 4. 2003 0:07

Pavel (neregistrovaný)

eeeh ? co je to za ptakoviny ?
proc bych si nemohl psat cast dokumentu v jinym kodovani ?
pokud ovsem nekdo neuvazuje o tom cpat diakriticke znaky do nazvu elementu a pod (coz by ovsem byla stejna demence jako cpat diakritiku du nazvu promennych, procedur/funkci/trid/cehokoli, ci dokonce klicovych slov programovaciho jazyku (podle me nepatri diakritika nikam jinam nez do dat a uzivatelskyho rozhrani, maximalne tak jeste do mailu od sefu a dalsich ignorantu).
klidne muzu mit neco typu
<xxx>
<enc1250>cokoliv v cp1250</enc1250>
<enc????>blah blah, cp ????</enc????>
</xxx>
a podle kodovy stranky pod kterou program pojede si vybrat relevantni polozku.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 4. 2003 8:17

martin hassman (neregistrovaný)

... a odsoudim se k tomu, ze nebudu moci pouzivat 90% dostupnych nastroju - pocinaje text editory, ktere mi od tohoto okamziku nezobrazi cely dokument spravne, ale vzdy jen tu cast se spravnym kodovanim a konce vsemi konvertory mezi kodovacimi tabulkami.

Tohle myslim do xml opravdu nepatri. Od ceho mame unicode, ze?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 4. 2003 15:29

Pavel (neregistrovaný)

ja jsem pouze rikal ze ta moznost tu je, ne ze by to mel nekdo delat ....

<joke>unicode je skvela vec, zavedeme si rovnou znaky pro f^n a bl, ne ? nebo pockame do hyper-space-wide-unicode verze s 32B na 1 znak a dostatkem znaku pro vsechny formy zivota v tehdy znamem vesmiru ?</joke>
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 4. 2003 10:06

Jezovec (neregistrovaný)

To prvni tvreni neni tak uplne pravda, podle specifikace muze nazev kodovani obsahovat pouze

[A-Za-z] ([A-Za-z0-9._] | '-')*
/* Encoding name contains only Latin characters */

Pro podrobnosti doporucuji
http://www.w3.org/TR/REC-xml#NT-EncodingDecl

Jezovec
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 4. 2003 11:28

Jindřich (neregistrovaný)

The EncName is the name of the encoding used.

Pokud to dobře chápu, jedná se o NÁZEV kódování, nikoliv o text. Tedy název kódování \"UTF-8\" žádné non-latin characters neobsahuje, ovšem v textu kódovaném v UTF-8 být mohou.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 4. 2003 10:37

Petr Cimprich (neregistrovaný)

"To neni tak docela pravda: XML sice obsahuje informaci v jake kodove strance je napsano, ale bohuzel uz napsanou v nejake kodove strance.. tzn. neexistuje zpusob jak zjistit kodovou stranku jeste pred ctenim dokumentu."

Jeste pred ctenim dokumentu jiste ne :)
XML ma pouze mechanismus, jak z nacteni nekolika prvnich bajtu jednoznacne urcit kodovani a znakovou sadu celeho dokumentu, aniz by predem byla znama. Funguje to prinejmensim pro Unicode a vsechny kodove stranky rozsirujici ASCII.

"Nehlede na neexistenci moznosti zapsat cast dokumentu v jine kodove strance."

K tomu jsou externi entity.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 4. 2003 11:04

Aznoh (neregistrovaný)

>Jeste pred ctenim dokumentu jiste ne :)

Mel jsem na mysli to, ze musite precist cast dokumentu UZ V URCITEM KODOVANI abyste zjistili ahaaa, je to kodovani to a to. Ano, funguje pro ASCII, ale uz ne pro Unicode ( LE,BE), pouze pro Utf-8, ale hlavne ne pro EBCDIC atd

>K tomu jsou externi entity
Cekal bych, ze my takovy format umozni napsat slovnik, treba Japonsko-Cesky, kde jednoznacne potrebuji dve zcela odlisna kodovani

nerikam ze xml je shit, rikam ze xml je bohuzel shit
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 4. 2003 11:24

Meap (neregistrovaný)

Nejak mi unika smysl, proc pouzivat vice kodovani v jednom dokumentu. Konkretne k tvemu prikladu by ti stacila UTF16, ktera pokryje oba jazyky.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 4. 2003 11:32

Tin (neregistrovaný)

Myslim ze jde rozponat minimalne UTF-8 a UTF-16, LE i BE. EBDIC asi vazne neprojde.

http://www.w3.org/TR/REC-xml#charencoding
"Entities encoded in UTF-16 must begin with the Byte Order Mark described"

Mimochodem vis o lepsim zpusobu rozpoznavani kodovani?

Tin
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 4. 2003 11:37

Petr Cimprich (neregistrovaný)

"Ano, funguje pro ASCII, ale uz ne pro Unicode ( LE,BE), pouze pro Utf-8, ale hlavne ne pro EBCDIC atd "

Mam za to, ze Unicode ma byte-order mark pro rozliseni UTF8/16 a LE/BE. S EBCDIC bohuzel nemam zkusenosti. Urcite existuji systemy, kde se autodetekce nepovede, ale presto se domnivam, ze se XML k i18n stavi celem.

A japonsko-cesky slovnik bych, kdybych umel japonsky, pohodlne napsal cely v Unicode. Spis bych mel problemy s fonty a editorem, nez jak to ulozit do XML.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 4. 2003 10:13

Vítězslav Novák (neregistrovaný)

A on se EBCDIC jeste nekde pouziva? Za meho mladi si konkuroval s ASCII, ale mel jsem dojem, ze za tech celkem dost let ho ASCCI spolehlive pobil.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 4. 2003 20:45

Petr Herma (neregistrovaný)

Obcas se s tim setkam na IBM, treba v bankach to jeste pouzivaji.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 4. 2003 12:27

Abraxis (neregistrovaný)

XML kodovani - funguje to takto (pokud si to dobre pamatuji), ze:
- prectenim prvnich par bytu zjistis urcite pocet znaku na znak a mozna kodovani
- jakmile znas pocet znaku na znak, tak neni problem zjistit si z hlavicky kodovani

Vlákno názorů k článku Proč XML není jen bublina od Aznoh - RE: internacionalizace To neni tak docela pravda: XML sice...

Dále u nás najdete

Samsung Care+ v Česku nabídne opravy bez omezení

Filip Sajler vaří obědy pro firmy. Prodávají je chytré lednice

Apple opravil bezpečnostní chybu, která byla v iOS od verze 1.0

Konec soukromí jak ho známe?

Poslední den na přiznání k dani z nemovitostí a dani silniční

Notepad++ byl šest měsíců pod kontrolou čínských hackerů

Na magnetické rezonanci nedaleko Prahy mají volno

Hledala dokonalý šálek, našla životní vášeň a učí pít kakao

Nedostatek a zdražování RAM pamětí není dočasný výpadek

Weby v ČR mají být přístupné pro lidi s omezením

Privátní značky se někdy nevyplatí. Nejvíce se dá ušetřit na drogerii

Česká jablka jsou plná pesticidů, ukázal test. Ovocnáři se bouří

Špionáž v Googlu a phishing na Signalu

Máslo bude levné až do podzimu

Mecha Comet: modulární kapesní počítač s výměnnými prvky

AI odhadne vaši osobnost z fotky a dokonce předpoví váš plat

Začínající podnikatel: Základní pojmy z účetnictví

Sportovní kanál České televize slaví dvacet let

Kyberbezpečnost českých nemocnic je dál špatná

Investice do zbrojení: Tři experti radí tipy, co by se mohly vyplatit