Názor: písmeno není obrázek a obrázek není písmeno. Obrázky (kliparty) nemají v kódování, potažmo fontu, co dělat. A vím, byly i v původní ascii (obličeje, semigrafika), ale to je trochu něco jiného.
10. 9. 2025, 10:37 editováno autorem komentáře
hieroglyfy jsou taky obrazky i pismo, i smajlici jsou komunikacni prostredek, pismenko A je domecek.
⌂hoj
(grrrrr, root.cz má rozbitý Unicode a bylo potřeba použít entitu)
10. 9. 2025, 13:32 editováno autorem komentáře
Docomo - japonský mobilný operátor s tým začal. Mal takú svoju verziu internetu. Prišlo im skvelé miesto zastaralých smajlíkov používať rovno písmenkové obrázky. Asi nejak to vychádza z ich kawaii kultúry. Potom to prešlo do unicode.
Ted je otazka, zda te miji myslenkove pochody, ktere z omalovanek udelaly pismo. No a jelikoz unicode obsahuje hodne historickych dnes jiz nepouzivanych pisem, pak i ty omalovanky maji v unicode smysl...
původní ascii (obličeje, semigrafika)
Opravdu? Původní ASCII nemělo ani malá písmena. Současné ASCII stále semigrafické znaky nemá.
Nepletete si to třeba s PETSCII nebo jinými osmibitovými (narozdíl od ASCII, které je sedmibitové) sadami znaků, které použily řídící znaky, z nichž se mnohé nemohou v textu vyskytovat, ale ve framebufferu ano, na semigrafiku, jako například výchozí EGA/VGA znaková sada, známá také jako CP 437?
Díky za opravu. Měl jsem na mysli 8bit anglické kódování používané na PC (od CGA, Herculesu, po výchozí font EGA/VGA). Tedy CP437, jak píšete.
10. 9. 2025, 14:31 editováno autorem komentáře
Třeba čínština a příbuzné jazyky také nejsou písmena, ale v univerzální znakové sadě ji nepochybně chceme. No a když čínské znaky, tak proč ne hieroglyfy – jak by se nadefinovala dělící linie? To je jeden důvod.
Druhý důvod – ještě nebyl vynalezen univerzálnější textový formát, než je plain text. Další spousta formátu na něm staví. No a lidé chtějí různé emoji v textu používat. Takže buď přesvědčíte celý svět, aby všude, kde se dnes používá čistý text (včetně věci jako Markdown, HTML, XML, JSON, databáze nebo komentáře tady na Rootu) začal používat nějaký nový formát, který bude umět používat znaky z Unicode bez emoji a k tomu přidávat emoji nějakým jiným způsobem. A nebo holt ty emoji přidáte do Unicode a bude se s nimi zacházet jako se znaky.
Kdybyste mohl zrušit celé současné IT a vytvořit úplně nové od nuly, kde nebudou tisíce různých formátů pro práci s formátovaným textem, ale byl by tam jeden správný formát™, pak by bylo vaše řešení správné. V našem světě je přidání emoji do Unicode velmi pragmatické řešení. A popravdě Unicode už byl v té době takový mišmaš, že přidání emoji nic nezhoršilo.
10. 9. 2025, 21:07 editováno autorem komentáře
Vždyť lidi používají sotva nějaký základní set "nálad", který se vejde na displej vedle/místo softwarové klávesnice (a dosti koreluje s tím, co jsme dělali dřív pomocí běžných znaků :-) ). Ty tisíce dalších obrázků jsou z pohledu bfu úplně zbytečný. Pár různých nadšenců si s tím hraje víc, ale pak jejich výstup vypadá minimálně silně infantilně.
Z vašeho a mého pohledu máte pravdu. Ale tam venku za okny kanclu, v reálném světě, používá nejrůznější emotikony spousta lidí, a často se v tom vyžívají. Výsledek podle mě vypadá infantilně až slaboduše, ale to je jen mé hodnocení "starce", který pamatuje CP 437. A to jsme si kdysi mysleli, že code page se 65536 znaky fakt musí stačit každému ;)
V pekle je jiz vyhrazeno misto pro toho pitomce, kterej prisel s napadem zaradit do unicode "emoji".
Poděkuji Japonsku, Google, že jim chtěl podlézat a Applu, že postavil cestu do pekla.
Tady to začalo https://www.unicode.org/L2/L2007/07257-emoji-wd.html a tady se už stavěla cesta https://www.unicode.org/reports/tr51/tr51-1-archive.html. Máš tam i hromadu odůvodnění, proč je vlastně dobré mít cestu do pekla, že tam budeš také rád chodit.
Vůbec ne. Prosadilo se dávno před módou tzv. emoji. Před tím lidi stálo hromadu času a nervů konvertovat texty mezi různými kódováními a řešit „rozsypaný čaj“, takže byli rádi, že mají jedno kódování, které umožní mít v jednom textu češtinu, němčinu, francouzštinu, ruštinu, čínštinu atd. Taky to nebylo bez problémů a užili jsme si s tím svoje (do té doby platilo bajt = znak a většina softwaru a programovacích jazyků s tímhle předpokladem počítala), ale celková bilance je jednoznačně kladná (a vůbec k tomu nepotřebuješ nějaké přiblblé obrázky).
No právě že unicode se prosadilo tam kde se řešila nějaká ta čeština, ruština, čínština a podobně.
V USA samozřejmě nic takového nepotřebovali a i když se to v megakorporátech a regulovaných odvětvích objevilo, tak se na to vývojáři a správci dívali s despektem jako na každý jiný "komunistický výmysl"
Takže hypotéza že to bylo právě Emoji které přineslo skutečně relevantní tržní argument proč unicode začít používat mi dává smysl. Ale zda je to pravda netuším, dokonce si ani nejsem jistý zda to časově koreluje.
Mozna tobe to dava smysl, nam vsem kteri jsme si to obdobi prozili to smysl nedava. I ten emericky korporat se potrebuje prizpusobit lokalnim podminkam kdyz hodla dobyvat celosvetove trhy.
Já jsem si to období právě prožil a pamatuji si to.
. I ten emericky korporat se potrebuje prizpusobit lokalnim podminkam kdyz hodla dobyvat celosvetove trhy.
No to je přesně ten "megakorporát" který jsem zmiňoval. Tam skutečně vedení dospělo k názoru že ano, potřebují "IT systémy" které budou fungovat celosvětově a v různých jazycích. A vydali patřičný befel, který ovšem řadoví vývojáři a IT správci nesli velmi nelibě a často se to snažili ošvejkovat (alespoň do doby než vedení došla trpělivost a najmuli i armádu indů, ale to už se dostáváme do jiného skeče).
Menší korporáty samozřejmě na něco takového totálně dlabaly a pokud měli zahraniční pobočky, musely veškerý SW dělat samy.
Zcela vlastní kapitolou jsou pak korporáty evropské, kde unicode není zcela samozřejmě ani v roce 2025. Například v Německu nebo Rakousku rozhodně nedoporučuji zkoušet používat jména s českou diakritikou. On je někdy problém i s umlauty a ß, nad tím lze prostě jen zakroutit hlavou.
No nic, to jsou všechno relativně offtopic věci.
Např. podle Wikipedie se ty počátky datují 2007-2014:
„Beginnings of Unicode emoji (2007–2014)
The first American company to take notice of emoji was Google beginning in 2007.“
Co si pamatuji, tak ten nástup byl hodně pozvolný a pro smajlíky se na webu dlouho používaly bitmapy, ne Unicode Emoji.
V GNU/Linuxu se ta podpora objevovala někde kolem roku 2000 (počátky někde v koncem 90. let) a výchozí to bylo o pár let později. Zažil jsem ještě Latin2 jako výchozí kódování, ale jen chvíli. A v době toho přechodu myslím málokdo tušil, že nějaké Emoji vůbec existuje – lidem šlo primárně o to, že bude jedno společné kódování pro různé jazyky, případně že to zvládne lepší typografii. Smajlíci se psali spíš textově :-).
Na UTF-8 je skvělá ta zpětná kompatibilita s ASCII – ten základ je stejný a UTF-8 můžeš číst jako ASCII a většina textu bude čitelná (což tedy platí i pro většinu osmibitových kódování a třeba u bratrů Kamenických to dovedli k dokonalosti tím, že české znaky s diakritikou dali na pozice, kde jsou podobně vypadající znaky v CP437, takže i při záměně těchto kódování byl text čitelný). Tzn. nepřijde mi, že by to nějaký pojídač hamburgerů chtěl bojkotovat, protože i po přechodu na UTF-8 je to jeho ASCII pořád čitelné – a ty znaky národních abeced si nepřečetl ani před tím, takže to mu může být jedno.
Na druhou stranu ani teď po tolika letech, není Unicode/UTF-8 všude a dokonale implementované. Pořád můžeš narazit na chyby, že ti někde zkomolí jméno nebo adresu, takže kolikrát je jistější uvádět tyhle údaje bez diakritiky (např. u nákupů přes internet – byť většinou už to funguje, ale ale občas to nějaká tiskárna štítků nebo systém nedá).
Hlavní problém použití Emoji vidím v tom, že to rozbíjí text a poutá pozornost v místech, které ji nezasluhují. Nahrazovat tím slova v textu mi přijde vyloženě hloupé a škodlivé. Smysluplné využití si dovedu představit někdy místo odrážek nebo jako první znak nadpisu, kde to zvýraznění a upoutání pozornosti je na místě.
Pořád můžeš narazit na chyby, že ti někde zkomolí jméno nebo adresu, takže kolikrát je jistější uvádět tyhle údaje bez diakritiky (např. u nákupů přes internet – byť většinou už to funguje, ale ale občas to nějaká tiskárna štítků nebo systém nedá).
To je ale způsobené spíš použitím morálně zastaralých technologií, než že by to něco principiálně nepodporovalo. Asi jako když nějaké zařízení nepodporuje IPv6, ale jiná řada od toho samého výrobce umí IPv6 bez problémů.
Vyloženě chybu v implementaci UTF-8 už jsem několik let nepotkal. Ale je fakt, že to vyladění všech systémů trvalo docela dlouho. Možná i proto, že se to podle mne testovalo převážně ve střední Evropě – na západ od nás se s ne-ASCII znaky setkávali tak málo často, že bylo nepravděpodobné, že na nějakou chybu narazí. A na východ od nás asi zase používali jiná kódování, protože UTF-8 pro ně není zrovna efektivní.
Hlavní problém použití Emoji vidím v tom, že to rozbíjí text a poutá pozornost v místech, které ji nezasluhují. Nahrazovat tím slova v textu mi přijde vyloženě hloupé a škodlivé. Smysluplné využití si dovedu představit někdy místo odrážek nebo jako první znak nadpisu, kde to zvýraznění a upoutání pozornosti je na místě.
Já bych to, jaké znaky budou používat, ponechal na pisatelích. Unicode je technický standard, ten fakt nemá sloužit k tomu, aby diktoval lidem, co a jak smějí psát.
Jen za poslední týden jsem se s pokaženými texty setkal třikrát (adresa na balíku z e-shopu, jméno souboru původem na Apple, firemní dokument s nestandardním písmem). Přístupy na všelijak ponastavené linuxové terminály nepočítám.
Takže ono to úplně bez problémů zatím není - ani desítky let nestačily k úplné konsolidaci. Nicméně UTF-8 je zřejmě krok správným směrem.
V principu mi emoji v Unicode nevadí, ale jsou vázané na barevná zobrazovací zařízení. Jakmile takový dokument člověk vytiskne na běžné laserové tiskárně, je tam jen spousta fleků a puntíků
.
Vylepšené o automatickou náhradu běžných smajlíků za emoji a provázání komunikačních kanálů. Pak člověku pošle manager k vytištění dokument s komunikací z e-mailu a z Teams, kde se sdělení ukrývá kdesi mezi skvrnami...
jsou vázané na barevná zobrazovací zařízení
Nejsou. To, že se někde nepoužijí šedé nebo černobílé varianty není chyba standardu.
Já to nepovažuji za chybu standardu - ona je to spíš vlastnost.
Problém je, že těch míst, kde by byly černobílé varianty (správně) implementované, je pomálu. A (naše) firemní tiskárny (či tiskové servery?) do této kategorie rozhodně nepatří.
V současnosti mi to přijde takové hodně násilím tlačené
(např. to automatické zaměňování v komunikátorech), ale zároveň nedoimplementované
.
Ad použití Emoji vidím v tom, že to rozbíjí text a poutá pozornost v místech, které ji nezasluhují - například v korejštině se podle všeho používají čínské znaky (resp. hanja) pro ustálené termíny typu Čína, Japonsko, Ministerstvo zdravotnictví apod. To právě umožňuje zvýraznit některé části textu. Ale vypadá to, že vyjma novinových titulků, některých oficiálních dokumentů a kreativního/dekorativního použití se to už moc nepoužívá.
https://en.wikipedia.org/wiki/Korean_mixed_script#:~:text=almost%20only%20used%20for%20abbreviations%20in%20newspaper%20headlines
Používat emoji jako drop caps mě nenapadlo, a je to skvělá myšlenka :)
https://en.wikipedia.org/wiki/Initial#Drop_cap
On by relevantní obrázek byl i užitečnější než víceméně náhodné první písmeno prvního slova, které akorát poutá pozornost, ale jinak žádnou přínosnou informaci neposkytuje.
Ad použití Emoji vidím v tom, že to rozbíjí text a poutá pozornost v místech, které ji nezasluhují
To samé se dá říct o textu psaném kapitálkami, tučném písmu, zvýrazňování hvězdičkami apod. Což ovšem neznamená, že lidé nemají mít tu možnost.
Navíc emoji se nemusí používat jen uvnitř odstavcového textu. Třeba zdejší tlačítka pro hodnocení jsou vlastně také emoji. Často potřebujete na text jednoduché reakce typu viděl jsem, souhlasím/nesouhlasím, děkuji apod. K tomu nepotřebujete něco složitě psát a nemusí to pak každý zase číst – stačí jedna emoji.
Nebo se dají emoji „zneužít“ třeba pro rychlé hlasování. Někde máte možnost přidávat emoji reakce, a potřebujete se domluvit na termínu. Ajťák jde na Doodle, vytvoří anketu, nechá hlasovat. Ne-ajťák napíše možnosti a označí je pomocí emoji čísel ve čtverečku. Stejná emoji dá jako reakce a hlasuje se kliknutím na odpovídající číslo. Jednoduché, ale účinné.
Když se nějaká funkcionalita dobře používá i pro účely, pro které původně vůbec nebyla zamýšlena, podle mne to obvykle značí to, že ta funkcionalita byla navržena dobře.
No já nevím. Zrovna v USA korporace jménem Microsoft postavila Windows NT kompletně nad Unicodem, od první verze. Všechna ne-Unicode volání, zavedená pro zpětnou kompatibilitu s Windows 3.x/95, DOSem, Unixem a OS/2, se interně převádí na Unicode formu, a pak případně zpátky.
Což je skvělý příběh, který kazí jen "drobné detaily". Na prvním místě autoři aplikací na Unicode poněkud kašlali. Teprve po příchodu Windows XP, které se staly prvním skutečně mainstreamovým OS založeným na NT, se dalo říci, že se aplikace přizpůsobily. A i poté léta existovaly výjimky.
Na dalším místě Microsoft zvolil 16-bitové WCHARy. To mělo skvělý smysl, protože Unicode měl popisovat 65536 znaků, a nikdy více. Takže jeden WCHAR je jeden znak, a nejsou potřeba žádné obezličky jako v případě UTF-8. A to přesně do doby, kdy se Unicode rozrostl nad těch 65536 znaků, a bylo potřeba zavést UTF-16, které přináší většinu problémů, které má UTF-8. Navíc problémy nastaly už před tím, když se ukázalo, že řekněme ö lze zapsat jako U+00F6 (ö), nebo jako U+006F (o) U+0308 (¨). K tomu přišly Unicode Normal Forms, a Apple si neomylně vybral něco jiného než zbytek světa... Aneb mysleli jsme to dobře, ale dopadlo to jako vždycky.
https://en.wikipedia.org/wiki/Unicode_equivalence#Normalization
Windows NT byly postavené nad UCS-2 což je jen část Unicode. Až novější verze mají UTF-16 a ještě v XP to mělo nějaká omezení. Jen dodatek k tomu, jak MS postavil NT nad Unicode od první verze. No ne no.
Unicode 1.0 byl postavený jako 16-bitové kódování. Rozšíření nad 16 bitů přišlo až v Unicode 2.0 ve formě surrogate pairs, což je UTF-16. Do té doby neexistovalo žádné UCS-2, byl to prostě Unicode. Mimochodem počet znaků se dostal nad 65536 až s Unicode 3.0 v roce 2001.
https://en.wikipedia.org/wiki/UTF-16#:~:text=early%202-byte%20encoding%20was%20originally%20called%20%22unicode%22
Podporu pro UTF-16 pro vstup, výstup a třídění přinesly už Windows 2000. V linku se dozvíte, že podporu bylo potřeba zapnout v Registry. Buď ručně, nebo to automaticky dělal Language Pack používající "supplementary characters", tj. tehdy čínské, japonské a korejské znaky. Bez toho language packu stejně nebyly nainstalované fonty a IME, takže jste ty znaky nezobrazil ani nevložil. Mimochodem CJK fonty mají až 30 MB (byť tehdy byly o něco menší), a Windows 2000 měly v minimal HW requirements 64 MB RAM. Velikost instalačního CD byla okolo 370 MB, a multi-language pack s French, German, Spanish, Swedish, Dutch, Italian, Korean, Chinese Simplified and Chinese Traditional měl 485 MB. To kdybyste se ptal, proč všechny ty Language Packs nebyly na instalačním CD.
https://learn.microsoft.com/en-us/windows/win32/intl/surrogates-and-supplementary-characters#:~:text=Note-,windows%202000,-introduces%20support%20for
V době vzniku Windows NT nebylo žádné UCS-2 a to, co tak dnes označujeme, bylo tenkrát UTF-16. A bylo to tehdy nejlepší možná volba.
Byl velký průšvih, že autoři Unicode řekli „dva bajty pro reprezentaci znaků budou na věky stačit každému“. A za pár let si to rozmysleli a s Unicode 2.0 řekli „hm, tak ne“. A to už bylo po zkušenostech s IPv4, kdy už bylo jasné, že dojdou. Blížil se rok 2000. Dávno bylo známé „640 kB paměti musí stačit každému“. Přesto bylo Unicode 1.0 navrženo bez rezervy v řádech.
Na druhou stranu je otázka, zda kdyby v roce 1991 rovnou přišlo kódování, které by pro jeden znak v pevné délce kódu mělo 4 bajty, zda by se vůbec ujalo.
A co konkretne ti vadi na emoji?
A treba pipnuti (BELL - 0x07) nebo "navrat voziku" (CR - 0x0D), coz jsou ridici znaky pro 70 let stare pocitace ti nevadi? :-)
Je potreba si uvedomit, ze napr. cinske znaky byvaji zalozeny historicky na obrazcich. Treba znak slunce je puvodne jednoduche kolecko . Znak slona kdysi byl opravdu obrazek hlavy slona, nez se vyvinul do dnesniho tvaru.
Takze pokud kritizujete pritomnost emoji v UTF, tak byste meli kritizovat i pritomnost cinskych znaku a treba hieroglyfu.
Nebo muzete povazovat emoji slunce jako prapredek cinskeho znaku pro slunce.
Me osobne emoji taky lezou krkem, ale nedokazu si logicky obhajit proc by je unicode nemelo obsahovat. Problem je leda v tom, ze tech veci co muze mit vlastni emoji je ve vysledku nekonecne.
Ono nejde až tak o to, jestli jsou ve standardu nebo ne (tam až tak moc nepřekážejí), jako spíš o to, jak a kde se používají (což tedy taky standard řešit nemůže, maximálně by mohl něco doporučit, ale v technickém standardu je to víceméně mimo téma). Takže ono to „nadávání na emoji“ je spíš takových povzdech, vyjádření znechucení a snaha naznačit ostatním, že trochu střídmosti by neškodilo.
Tomu povzdechu rozumím, vidím to stejně. Jenže to je jako povzdych důchodce nad tím jak jsme dřív nebyli bohatí, ale lidé si měli blíž a byli upřímnější, mladí měli úctu ke stáří, jídlo lépe chutnalo, léto bylo opravdové léto a zima byla opravdová zima, všechno bylo daleko levnější, a i těch deset deka šunky byla pořádná hromada, a ne pár plátků jako dneska ;). V téhle fázi ani jeden ještě nejsme, ale teenageři by naše povzdechy nad používáním emotikonů vnímali velmi podobně.
No, nic proti, ale tohle není o dojmech. Je to podobné, jako když dnes přijde juniorní programátor a místo toho, aby si za půl hodiny nastudoval referenční dokumentaci dvě hodiny vejrá na nějaká videa a stejně se dozví houby. (Pravda, teď tuhle hrůzu snad jakž takž ze světa vytlačí AI.)
Nemluvě o tom, že to s teenagery nesouvisí. Četl jste někdy v poslední době něco třeba na LinkedIn? To máte chuť fackovat. A tam obvykle mají lidé do teenagerů dost daleko.
11. 9. 2025, 18:35 editováno autorem komentáře
Jenom dodám, že junioři nebudou, protože je nahradí AI, a časem nebudou ani senioři, protože z nich budou důchodci.
LinkedIn nečtu, na to nemám nervy :)
Nemíchejte prosím konečnou množinu znaků "obrázkových písem" a nekonečnou množinu obecných obrázků zvaných emoji.
A proc ne? Pokud hodlas diskutovat, mel by jsi se rozepsat, abych aspon vedel proc mi zakazujes neco delat :) Jedine ceho se muzu u tveho vykriku chytnout je konecnost vs nekonecnost. Ale matematici takove mnoziny michaji bezne...
Tohle ale není matematika, ale nějaký standard. A z výše uvedeného je zřejmé, že nikdy nepokryje nekonečnou množinu, stejně jako nejde o exaktní zástupnou symboliku (ten smajlík brečí, směje se až brečí, nebo se tak potí? Ta opice je spíš orangutan, nebo reprezentuje i makaka?), jako u písma jakéhokoli druhu. Proto to imho do vzájemného srovnání vůbec nepatří.
Znaky obrazkovych pisem taky nejsou jednoznacne. Treba mnou zminovany cinsky znak, dle wiki znamena "Radical 72 or radical sun meaning "sun" or "day" "
Takze jednoznacnost vyvracena.
Nikdy nepokryje nekonecnou mnozinu - a to vadi? Cinske znaky taky nikdy nepokryjou cely vesmir. Staci kdyz unicode pokryje dostatecnou mnozinu, to jest tu co pozaduji lidi.
(A jelikoz nelze zadat do nekonecna, nemusi unicode pokryt nekonecnou mnozinu :) )
Takze pozadavek pokryti nekonecne mnoziny taky vyvracen.
Co tam mas dal? Ale vazne - tyhle uvahy by jsi urcite zvladnul taky, kdyby sis neco precetl o jinych zapisech nez latince.
C a H znamenají také něco jiného, jdou-li rovnou za sebou. O tomhle to přece vůbec není. Písmo je od toho, aby konečnou množinou znaků vyjádřilo nekonečno významů. I když má písmo prazáklad v obrázcích, opačně to prostě nefunguje.
Co říká emotikon prasete následovaný opicí a psem? Nic. Není to písmo. V nějakém egyptském hieroglyfickém systému to ale mohlo být třeba slovo "politik". Snažím se jen vysvětlit, že písmo != emoji obrázek a nedává mi smysl to míchat dohromady a zasírat tím standard.
Asi jsi poruchovy. Opakuji:
Unicode obsahuje historicka pisma, coz tobe nevadi.
Historicka pisma jsou obrazky veci.
-> Unicode obsahuje obrazky veci.
Emoji jsou obrazky veci. Pokud jiz unicode obsahuje obrazky veci, proc tam nechces mit dalsi obrazky veci? Obrazky veci co vznikly kdysi jsou ti koser, ale obrazky veci co vznikly dnes uz jsou spatne? A kde je hranice?
"Písmo je od toho, aby konečnou množinou znaků vyjádřilo nekonečno významů." - to je tvoje definice. Mam hledat jine definice od lidi kteri nad tim premysleli dele nez 5 sekund narozdil od tebe, nebo pro zmenu udelas neco i ty sam?
Co rika emotikon prasete nasledovany opici a psem asi nic, ale unicode U+1F379 nasledovany U+1F555 je , neboli "drink 6 hodin". Pokud ti tohle prijde jako zprava od hezke slecny, tak na to mas reagovat unicode U+1F44D , palec nahoru. Pokud reagovat nebudes, prijdes o rande.
Pochop ze v japonsku se emoji takhle opravdu pouziva. Nebo mezi pubertaky u nas. Nebo dokonce i mezi dospelymi lidmi u nas. Zkus nejaky socialni kontakt mimo svou bublinu. Mohl by sis o tom nejprv neco precist nez tady budes zase porchove psat?
Všetci sa tu sťažujú, ale nie je to pekné napísať:
```
𓁜𓂀𓁠 <𓐭𓁉𓄙𓅊 𓆦>
𓆌𓆚𓆣 𓁂𓇽𓁡(𓆦 𓀠𓉠𓌲 𓅇, 𓆦 𓀠𓉠𓌲 𓅓) 𓂘 𓍹𓎬𓍻 𓅇 𓋠 𓅓; 𓂓
𓁜𓂀𓁠 <𓐭𓁉𓄙𓅊 𓆦>
𓐭𓁉𓄙𓅊 𓇣𓈌𓂓
𓂘
𓅘𓁚𓆫:
𓁜𓂀𓁠 <𓐭𓁉𓄙𓅊 𓋍>
𓆌𓆚𓆣 𓃚𓌌𓋹𓅀(𓋍&& 𓋗, 𓆦 𓀠𓉠𓌲 𓅇, 𓆦 𓀠𓉠𓌲 𓅓)
𓂘
𓍹𓎬𓍻 𓋗(𓅇, 𓅓);
𓂓
𓂓;
𓀡𓀽𓃩 𓁩𓉢𓁪()
𓂘
𓇣𓈌𓂓<𓀡𓀽𓃩> 𓅅𓀎𓃦;
𓀡𓀽𓃩 𓃕 𓈈 𓅅𓀎𓃦.𓃚𓌌𓋹𓅀(𓁂𓇽𓁡<𓀡𓀽𓃩>, 1, 2);
𓁭𓃌𓁔 𓂁 𓃕 𓂁 𓄃𓃠;
𓂓
```
No, nie je to krása? Toto je zdrojový kód v programovacom jazyku C++
11. 9. 2025, 21:00 editováno autorem komentáře
Doopravdy je to jenom tvoje predstava jak by stari egyptane zapsali zdrojak.
Ale nevim proc jsi zvolil treba 𓁜𓂀𓁠 jako class? Proc zrovna tyhle hieroglyfy?
Nas obrovsky SCADA system mi pri nacitani buildovacieho logu hlasil chyby. Podarilo sa mi zistit, ze chyby boli sposobene simultannym zapisom z viacerych vystupov do jedneho logu a prepinanim vstupu niekde v strede viacznakovych unicode znakov. Logy sa vyriesili, aby si neskakali navzajom do zapisu, ale najst to bola fakt fuska :).
PS: nebyt nemecky hovoriacich kolegov ktori napriek nariadeniu pouzivali v kode nemecke znaky, ani by ten problem nebol viditelny, takto Python hlasil neplatne unicode znaky
12. 9. 2025, 08:18 editováno autorem komentáře
Řešil jsem kdysi dávno podobný problém ve webovém serveru Jetty. Pokud přišel vícebajtový znak po síti rozdělený do dvou paketů (hranice paketů byla uvnitř vícebajtového znaku), tak se znak dál do aplikace poslal dvakrát.
Na problém se přišlo na AbcLinuxu.cz, protože se občas stalo, že se při editaci komentáře, zápisku nebo článku zdvojil znak s diakritikou. Na tyhle problémy se holt muselo přijít ve střední Evropě, protože na západě se vícebajtové znaky v UTF-8 používaly tak málo, že byl problém to vůbec zaznamenat, na východ se zase asi používala jiná kódování, než UTF-8. Že se to vašim kolegům podařilo najít v němčině pravděpodobně na jediném znaku ß je docela kumšt :-)
Ono sa im to ani tak nepodarilo najst, ako skor sposobit :). Hladat pricinu som potom musel ja. A nemci tych specialnych znakov maju viac - Ä, ä, Ö, ö, Ü, ü. To ze sa musia takto podpisat je blbost, ale ze este aj komentare pisu nemecky, ked firemna politika je vsetko po anglicky, to uz nepochopim.
Ako clovek so sice kratkym priezviskom, no zaroven pozostavajucim vylucne zo specialnych znakov, v zahranici nemam lahke vysvetlovanie, ako tu zmat znakov vyslovit. Ale ze mi este aj Hornbach na Slovensku takto znemozni registraciu som necakal https://imgur.com/a/TGnxlW3.
Bůhví proč jsem si myslel, že ty znaky s přehláskou se v UTF-8 kódují jednobajtově. Ty registrační formuláře, které mne přesvědčují, že se jmenuju jinak, než se jmenuje, mne vždy pobaví. Chápu, že za tím může být nějaký starý backend, který by to nezvládl – ale kdyby aspoň ta chybová hláška byla srozumitelná a třeba prostě normálně přiznala, že mám napsat jméno bez diakritiky. Tohle ale nejsou problémy Unicode, úplně stejné problémy by byly, kdyby ten web používal jakékoli jiné kódování mimo ASCII.
Obdobně například některé organizace neumí v emailu TLD jiné než se dvěma nebo třemi písmeny. Pokud máte primární email řekněme na doméně .cloud, tak se dozvíte, že nejde o platnou emailovou adresu. Jedním z provinilců je Česká pošta.
Vždy se to snažím hlásit, aby to opravili. Protože když jim to nikdo neřekne, tak to zůstane stejné ještě desítky let. U problémů s diakritikou ve jménu doporučuji dělat totéž. V USA by asi nemělo smysl řešit, že třeba příjmení "Říčný" psáno s diakritikou nefunguje, ale v našich zemích to fungovat prostě musí.