Zvlastni ze ruzne OS a aplikace tohle neuznavaj a hacky a carky dokazou vypsat nekolika zpusoby, treba i docela necitelne. Kdyby existoval opravdu jen jeden zpusob (utf-8 vsude a kazdy font vcetne specialnich znaku :)), tak by byl svet hezci, ale tohle nebude fungovat jeste dlouha leta vzhledem k tomu ze majoritni OS vytrvale veskere snahy o funkcni kodovani bojkotuje.
Problém ale vůbec není v tom, že existuje více kódování znaků (např. UTF-8 a ISO 8859-2 aneb Latin-2). Problém je v tom, že někdo vezme text, převede ho na bajty pomocí určitého kódování a když ty bajty příště čte, tak zapomene, jaké kódování pro zápis použil a načte je blbě.
U každých dat je potřeba mít informaci o jejich kódování – pokud ji nemáme, tak máme jen shluk bajtů a můžeme leda věštit, co to má být za text. Lze to řešit buď tím, že se dohodne výchozí kódování (např. většina instalací Linuxu a jiných rozumných systémů dnes používá UTF-8) nebo se prostě informace o kódování uloží do metadat (běžně HTTP hlavičky, MIME e-maily, XML atd.).
I když nebudeme pracovat s diakritikou (a co teprve takoví Číňané?) a omezíme se na „anglickou“ abecedu, stejně se kódování nevyhneme – stejně je potřeba někde mít informaci, že bajt 61 je a, 62 je b, 63 je c atd. Když nám tahle informace o kódování bude chybět, nebudeme vědět, jak ty bajty převést na text a vůbec nám nepomůže, že v tom textu není diakritika.
jsou ale informace, ke kterym encoding neprilepime. sef si stezuje, ze jsem se mu do mailoveho adresare ulozil "nejak divne" ... to proto, ze ja si napsal jmeno k e-mailove adrese, jak jinak, v UTF8 a on ma MS Utlak, ktery to nechape...
muj MP3 prehravac, porizeny letos na jare, take diakritiku neumi... a mobilni telefon (lowend) ma pri prepnuti do cestiny obcas nesmyslne znaky v popiscich v menu...
a kolik sem zazil trapeni s tim, kdyz mi nekdo poslal e-mail s rozpadlym kodovanim... ne, ne, ja budu psat jeste par let bez diakritiky!