Zvlastni ze ruzne OS a aplikace tohle neuznavaj a hacky a carky dokazou vypsat nekolika zpusoby, treba i docela necitelne. Kdyby existoval opravdu jen jeden zpusob (utf-8 vsude a kazdy font vcetne specialnich znaku :)), tak by byl svet hezci, ale tohle nebude fungovat jeste dlouha leta vzhledem k tomu ze majoritni OS vytrvale veskere snahy o funkcni kodovani bojkotuje.
Problém ale vůbec není v tom, že existuje více kódování znaků (např. UTF-8 a ISO 8859-2 aneb Latin-2). Problém je v tom, že někdo vezme text, převede ho na bajty pomocí určitého kódování a když ty bajty příště čte, tak zapomene, jaké kódování pro zápis použil a načte je blbě.
U každých dat je potřeba mít informaci o jejich kódování – pokud ji nemáme, tak máme jen shluk bajtů a můžeme leda věštit, co to má být za text. Lze to řešit buď tím, že se dohodne výchozí kódování (např. většina instalací Linuxu a jiných rozumných systémů dnes používá UTF-8) nebo se prostě informace o kódování uloží do metadat (běžně HTTP hlavičky, MIME e-maily, XML atd.).
I když nebudeme pracovat s diakritikou (a co teprve takoví Číňané?) a omezíme se na „anglickou“ abecedu, stejně se kódování nevyhneme – stejně je potřeba někde mít informaci, že bajt 61 je a, 62 je b, 63 je c atd. Když nám tahle informace o kódování bude chybět, nebudeme vědět, jak ty bajty převést na text a vůbec nám nepomůže, že v tom textu není diakritika.
jsou ale informace, ke kterym encoding neprilepime. sef si stezuje, ze jsem se mu do mailoveho adresare ulozil "nejak divne" ... to proto, ze ja si napsal jmeno k e-mailove adrese, jak jinak, v UTF8 a on ma MS Utlak, ktery to nechape...
muj MP3 prehravac, porizeny letos na jare, take diakritiku neumi... a mobilni telefon (lowend) ma pri prepnuti do cestiny obcas nesmyslne znaky v popiscich v menu...
a kolik sem zazil trapeni s tim, kdyz mi nekdo poslal e-mail s rozpadlym kodovanim... ne, ne, ja budu psat jeste par let bez diakritiky!
Diakritiku používám, protože většina dnešních mailových klientů umí používat Content-Type, pokud to nějakej neumí, je to zastaralej software, který nemá cenu zohledňovat. Nepíšu diakritikou akorát do předmětu emailu, protože ten nemá odkud zjistit typ kódování.
Prostě jsme v Česku, háčky a čárky patří k našemu jazyku a počítače+software mají sloužit lidem, takže se musí přizpůsobit tomu, aby diakritiku používaly. Už párkrát jsem byl svědkem toho, jak se někdo ptal, jak to má být správně napsáno (typický příklad: horky pro hořký nebo horký), ani z kontextu to nevyplynulo.
Takže za zprávu jsem jen rád a doufám, že se diakritika prosadí ještě víc. Jsem z Česka, ne z ASCIIska.
Dovolím si tak úplně nesouhlasit s tím, že kódování češtiny je poznat z hlavičky (Content-type), např. mnou využívaná antivir-antispam proxy jednoho nejmenovaného výrobce tuto hlavičku spolehlivě mrší (natvrdo nastavuje), ale s překódováním těla mailu už se nenamáhá, takže je sice prima, že patička "Zkontrolováno na přítomnost virů..." je v pořádku čitelná, ale text mailu je hlavolam.
Ad „Nepíšu diakritikou akorát do předmětu emailu, protože ten nemá odkud zjistit typ kódování.“
Viz RFC 2047.
Např. text „Čeština v předmětu“ se zakóduje jako =?utf-8?b?xIxlxaF0aW5hIHY=?= =?utf-8?b?IHDFmWVkbcSbdHU=?= a normálně se zobrazí.
Odkazované RFC pochází z roku 1996, dnes máme 2010, to je dostatečně dlouhá doba, aby se i ti pomalejší stihli přizpůsobit a obohatili svůj software o tuto hyper-moderní funkcionalitu :-)