Vlákno názorů k článku Historie vývoje GUI (10): počítače IBM PC a aplikace využívající textový režim od vks - no, ono to je tak normální. I dneska je...

Článek je starý, nové názory již nelze přidávat.

21. 12. 2010 15:58

vks

no, ono to je tak normální.
I dneska je všude kodovací babylon - obzvlášť když se jedná o web či databáze. navíc když se někdo pokouší natvrdo transformovat data do ISO 8859-1 ... zakázat veškeré jiné kodování než utf-8. nevim k čemu je dobré v dnešním světě škudlit na jednotlivých bajtech... když se ke všemu přicpe miliarda různých metadat a metadat k metadatům a tak dál...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 12. 2010 6:28

_pepak (neregistrovaný)

Proč "škudlit na jednotlivých bajtech": Protože s UTF-8 a UTF-16 je práce podstatně pomalejší (kvůli tomu, že má každý znak jinou délku, nemluvě o tom, že je potřeba uvažovat o odlišných byte-orderech) a UTF-32 zase svým zečtyřnásobením délky většiny běžných souborů plýtvá kapacitou až příliš.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 12. 2010 9:35

Pavel Stěhule

Práce s UTF8 nemusí být citelně pomalejší. Pro řadu úloh je rozdíl minimální, pro některé je nutné upravit některé algoritmy. UTF8 má jinak dost výhod, minimálně v tom, že ty nejdůležitější ASCI znaky jsou jedno bajtové a tudíž se ušetří čas v jiných operacích - např. při parsování textových souborů nemusíte řešit dvou a více bajtové znaky - většinou vás zajímají základní ASCII znaky a ty jsou jednobajtové, tudíž nedochází k žádnému výraznému zpomalení.

Pokud budeme řešit efektivitu jednotlivých kódování, tak se asi budeme bavit o hromadném zpracování dat - o databázích. Je otázkou jak to bude v budoucnu, nicméně aktuálně u db není procesor úzkým hrdlem. Problém je pomalé čtení dat z disku a málo paměti. Tudíž UTF8 je minimálně pro střední a západní Evropu nejvýhodnější. Latin2 by bylo výhodnější, ale to přeci jen nedostatečně pokrývá požadavky.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 12. 2010 17:40

Rado2 (neregistrovaný)

Myslím si že UTF-16 môže drvivá väčšina programov považovať za znaky s pevnou dĺžkov 2 bajty. Sám to tak robím :) Len nejaké špeciálne exotické znaky, ktoré som nikdy nevidel sú dlhšie.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 12. 2010 2:28

Sten (neregistrovaný)

Neměly by, otestování surrogate pair je poměrně jednoduché a rozbití kompatibility, pokud to neděláte, značné. Přesně kvůli takovým programátorům bylo tolik problémů s používáním horní paměti, s rokem 2000 a se zavedením UTF-8.

Mezi ty „speciální exotické znaky“ patří například noty (
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 12. 2010 2:30

Sten (neregistrovaný)

Tak ještě jednou a bez ukázek, zdejší redakční systém si s nimi neporadí, zřejmě také předpokládá UTF-16 jako dvoubajtové kódování :)

Mezi ty „speciální exotické znaky“ patří například noty, smajlíci, mapové symboly, značky (tagy) nebo matematická písmena.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 12. 2010 2:03

Sten (neregistrovaný)

UTF-8 je kódování na výměnu dat. Má jenom jednu endianitu (velkou), má automatickou synchronizaci (takže nevadí, když skočíte doprostřed znaku) a je celkem úsporné na místo. Převod mezi UTF-8 a UTF-32 je triviální a velmi rychlý (ne tak mezi UTF-8 a UTF-16).

UTF-16 je nesmyslné kódování, které s námi bohužel ještě dlouho pobude kvůli Windows a ICU/Java (tentokrát za to ale nemůže MS ani IBM, ale Unicode Consortium, když v Unicode 1.0 prohlásilo, že 16 bitů bude stačit — historie se opakuje :).

UTF-32 je ideální kódování na práci s daty v paměti. Na ukládání do souborů se moc nehodí kvůli plýtváním a endianitě.

Vlákno názorů k článku Historie vývoje GUI (10): počítače IBM PC a aplikace využívající textový režim od vks - no, ono to je tak normální. I dneska je...

Dále u nás najdete

V čem se EET 2.0 liší od EET 1.0? Přinášíme velké srovnání

Malware, ransomware a další online hrozby: Jak se liší?

USA chystají web na obcházení blokací obsahu

Zmatky u superdávky: přerušeno, zpracovává se a kdy dokládat

Handicap proměnila v úspěšný byznys, učí ženy nosit paruky

Plánované změny v penzích: Zjistili jsme další podrobnosti

Notepad++ opravil chybu zneužívanou k šíření malware

Rostoucí cena operačních pamětí zásadně zdražuje počítače

Je tu první vydání magazínu CIOtrends v tomto roce

Pojišťovny zneužívají lenosti svých klientů. Ti za to platí

Digitalizační masakr: stát chce data o zaměstnancích

Domácí péče hrazená pojišťovnou: kdo ji dostane a co pokryje?

Nedostatek vitaminu D se projeví únavou i špatnou náladou

Registrace cizinců podle JMHZV praxi

10 důvodů, proč lidi nenakoupí na vašem e-shopu

AI prolomila celou firemní infrastrukturu za 21 hodin

Konflikt na Blízkém východě: informace pro turisty

AI se snaží promlouvat i do stavebnictví

Sociální sítě: od seznamování k debatám o bezpečnosti

Pálení žáhy zhoršuje nevhodná večeře. Vadí přejídání i kafe