UTF-8 i UTF-16 se umí rozesrat. Doporučuji si to nastudovat.
V UTF-8 je možnost vytvoření neplatných sekvencí, ze kterých ani není jasné, jak vůbec vytvořit kód znaku. V UTF-32 se Vám žádná sekvence nerosere, max. se trefíte do momentálně nedefinovaného znaku, ale špatnou sekvenci položek prostě v UTF-32 nevyrobíte, protože to není možné. V UTF-8 a UTF-16 je možností špatných sekvencí mnoho.
Jejich formát je totiž přesně definován, ale připouští neplatné sekvence.
Doporučuji příště nastudovat, než začnete reagovat.

