Tak si shrňme, jaké operace provádíme s řetězci a jak si stojí UTF-8 ve srovnání s UTF-32:
- Kontrola platnosti – snadné v obou kódováních
- Podřetězec – kvůli kombinačním znakům pracné v obou kódováních, v UTF-8 o něco pracnější
- Změna velikosti písmen – obě kódování bez problémů
- Vyhledávání – obě kódování bez problémů
- Přenositelnost – UTF-8 bez problémů, UTF-32 platformově závislé
- Velikost – UTF-8 podstatně menší než UTF-32
Zkuste tedy popsat ty obrovské problémy, které UTF-8 ve srovnání s UTF-32 podle vás má.
Pokud celá aplikace využívá UTF-8 (což u PHP+MySQL není sebemenší problém), tak bude menší nejen objem zpracovávaných dat, ale tomu úměrně i rychlost. Neustálé konverze by vše samozřejmě zpomalily, ale já se kloním k tomu, aby UTF-8 proplulo celou aplikací bez jakékoliv konverze.

