Můžete prosím uvést znaky, které při změně velikosti zaberou v UTF-8 jiný počet bajtů? Měl jsem za to, že jednotlivé části prostoru jsou přiřazované tak, aby podobné znaky byly pohromadě.
Převodní mapa bude poměrně řídká, pro její uložení bych tedy volil hash tabulku, která dobře pracuje i s proměnlivou délkou klíče.

