Tomu nerozumim. Pokud je to rodina pisem, kde skoro kazdy jazyk ma svuj vlastni font, tak jak nastavit nazev fontu v HTML, Office... tak, aby se spravne zobrazily znaky z ruznych jazyku obsazenych v Unicode? Ja myslel, ze to bude jeden jediny font, co obsahuje 64.000 znaku. Jinak bych musel nastavovat co jazyk, to font, ne?
Pokud nepotrebujes pokryvat vic jazyku/regionu, staci ti jiny font, nez kdyz chces pokryt vse. Mrkni se na https://www.google.com/get/noto/ - ty prvni dva pokryvaji vse...
To v podstatě možné není. Současné Unicode má mnohem více než 2^16 (65536) znaků a bohužel většina systémů pro fonty neumožňuje více než 65536 znaků (OpenType font např. - až v roce 2014 představilo Adobe OTC které to obchází, obdobně i většina jiných formátů má toto omezení).
Vzhledem k tomu že CJK jazyky mají šílené množství znaků tak ty se tam většinou nevejdou a proto bývají specifické fonty pro ně. Jen unifikované čínské znaky zabírají cca 30% prostoru v 64K znacích, ve skutečnosti všechny (i vzácnější) čínské znaky mají více než 65 tisíc znaků samy o sobě, Korejský Hangul cca také 25%-30% (přestože je to slabikové písmo a ve skutečnosti má jen k stovce specifických znaků, tak pro potřeby písma je každá specifická slabika separátní znak).
Doporučuji kouknout na http://unifoundry.com/unifont.html a zejm. na obrázek http://unifoundry.com/pub/unifont-9.0.02/unifont-9.0.02.bmp o velikosti 4096x4096 pixelů který obsahuje všechny znaky v prvních 65536 znacích Unicode pěkně vizuálně (btw, velmi cool bitmapový font).
Upřesnění pro ty které to zajímá (ano, jsem jeden z nerdů který se zajímá o CJK jazyky :-) ) - moderních znaků je 24 pokud počítáme jednoduché znaky (consonants and vowels). Ale pak jsou digraphs (většinou vypadají jako smrsknutá kombinace 2 písmen) kterých je 27, a k tomu pak více než stovka zastaralých znaků (které minimálně samotné jsou v Unicode nadefinované) - (čerpáno z https://en.wikipedia.org/wiki/Hangul#Letters - bez toho abych cheatoval hledáním na wikipedii jsem věděl jen toliko že to s tím počtem není tak jednoduché.
Minimálně diphtongy ㅐ ae, ㅒ yae, ㅔ e, ㅖ ye, ㅢ ui bych považoval za samostatné znaky, protože je není možné nějak rozumně (alespoň pro mě) odvodit z jiných znaků a tedy je třeba se je naučit tak jako tak (jen to ui je kombinace u a i).
Pokud vím, tak je v CJK další problém. Aby se autoři Unicode vešli do limitu 64k znaků (což se nakonec stejně nevyšli), tak CJK ideogramy "sjednotili", a code point (řekněme číslo znaku v sadě Unicode) zastupuje význam, nikoliv jeho grafickou reprezentaci, která se v jednotlivých kulturách liší. Například znak U+8349 (grass) má v čínštině a japonštině odlišnou grafickou reprezentaci. Totéž příklad v prvním linku. Podle všeho se to dá řešit přes variant selektory, pokud to podporuje font a pokud jsou použité v textu.
https://en.wikipedia.org/wiki/CJK_Unified_Ideographs#/media/File:CJKV_variant_glyphs.png
https://en.wikipedia.org/wiki/Han_unification
Aby to bylo zajímavější, tak některé běžné znaky mají přímo v Unicode i "národní varianty". Navíc to vypadá, že tradiční a zjednodušené čínské znaky mají vlastní code pointy, což je přesně opačný přístup (prý protože tradiční vs. zjednodušené znaky byly oddělené v kódových stránkách vytvořených ještě před Unicodem). Takže U+4E1F je totéž co U+4E22 z hlediska významu (discard), ale vypadá to jinak.
Z toho celého vyplývá, že vytvořit jeden font pro čínské, japonské, korejské a vietnamské ideogramy je nejspíš technicky nemožné. Znamenalo by to stovky tisíc grafémů (řekněme vektorových obrázků).