Hlavní navigace

Názor k článku Ruby a unicode: bratři nebo nepřátelé? od Miloslav Ponkrác - Jenže já myslím, že doba, kdy se počet...

  • Článek je starý, nové názory již nelze přidávat.
  • 29. 10. 2007 13:25

    Miloslav Ponkrác
    Jenže já myslím, že doba, kdy se počet bajtíků považoval za nejlepší kritérium už je naštěstí doufám za námi.

    UTF-8 zvládne mnohem širší rozsah znaků, než UTF-16. UTF-8 je schopno zobrazit celou 32-bitovou sadu, UTF-16 jen 21 bitovou sadu. UTF-8 je kompletně přenositelné a multiplatformní, nejsou u něho problémy s endianitou, jako u UTF-16. Konec řetězce poznáte v UTF-8 snadno.

    Já osobně nevidím vůbec důvod proč někde preferovat UTF-16, opravdu jediný důvod je v tom, že (a to jen ještě v některých případech, spíše v menšině) je UTF-16 dokument o nějaké bajtíky kratší, ve většině případů je UTF-8 kratší, než v UTF-16. Ono i v těch asijských zemích často mixují latinku se svým písmem, a pak už vytváří UTF-8 výrazně kratší dokumenty, než v UTF-16.