Takže pokud se vrátím k vašemu původnímu tvrzení, že nevýhodou UTF-8/UTF-16 je, že se obě tato kódování umějí rozesrat, mám to chápat tak, že ostatní kódování a) mají definován způsob, jak naložit s vadným kusem sekvence b) a nemohou se (dle vašeho slovníku) rozesrat?
To asi nikoliv, že? Poškodit se mohou data v jakémkoliv kódování, v UTF-8 je pouze největší šance takové poškození odhalit.
ad rozsah mapování: výborně, začínáte tomu vcelku rozumět. Snad jen drobnost, Unicode nebylo oříznuto na 21b, ale rozšířeno na 21b ze 16b. (tj. nikdy víc než 21b nemělo a není po tom ani poptávka).

