Tomu nerozumim. Pokud je to rodina pisem, kde skoro kazdy jazyk ma svuj vlastni font, tak jak nastavit nazev fontu v HTML, Office... tak, aby se spravne zobrazily znaky z ruznych jazyku obsazenych v Unicode? Ja myslel, ze to bude jeden jediny font, co obsahuje 64.000 znaku. Jinak bych musel nastavovat co jazyk, to font, ne?
Pokud nepotrebujes pokryvat vic jazyku/regionu, staci ti jiny font, nez kdyz chces pokryt vse. Mrkni se na https://www.google.com/get/noto/ - ty prvni dva pokryvaji vse...
To v podstatě možné není. Současné Unicode má mnohem více než 2^16 (65536) znaků a bohužel většina systémů pro fonty neumožňuje více než 65536 znaků (OpenType font např. - až v roce 2014 představilo Adobe OTC které to obchází, obdobně i většina jiných formátů má toto omezení).
Vzhledem k tomu že CJK jazyky mají šílené množství znaků tak ty se tam většinou nevejdou a proto bývají specifické fonty pro ně. Jen unifikované čínské znaky zabírají cca 30% prostoru v 64K znacích, ve skutečnosti všechny (i vzácnější) čínské znaky mají více než 65 tisíc znaků samy o sobě, Korejský Hangul cca také 25%-30% (přestože je to slabikové písmo a ve skutečnosti má jen k stovce specifických znaků, tak pro potřeby písma je každá specifická slabika separátní znak).
Doporučuji kouknout na http://unifoundry.com/unifont.html a zejm. na obrázek http://unifoundry.com/pub/unifont-9.0.02/unifont-9.0.02.bmp o velikosti 4096x4096 pixelů který obsahuje všechny znaky v prvních 65536 znacích Unicode pěkně vizuálně (btw, velmi cool bitmapový font).
Upřesnění pro ty které to zajímá (ano, jsem jeden z nerdů který se zajímá o CJK jazyky :-) ) - moderních znaků je 24 pokud počítáme jednoduché znaky (consonants and vowels). Ale pak jsou digraphs (většinou vypadají jako smrsknutá kombinace 2 písmen) kterých je 27, a k tomu pak více než stovka zastaralých znaků (které minimálně samotné jsou v Unicode nadefinované) - (čerpáno z https://en.wikipedia.org/wiki/Hangul#Letters - bez toho abych cheatoval hledáním na wikipedii jsem věděl jen toliko že to s tím počtem není tak jednoduché.
Minimálně diphtongy ㅐ ae, ㅒ yae, ㅔ e, ㅖ ye, ㅢ ui bych považoval za samostatné znaky, protože je není možné nějak rozumně (alespoň pro mě) odvodit z jiných znaků a tedy je třeba se je naučit tak jako tak (jen to ui je kombinace u a i).
Pokud vím, tak je v CJK další problém. Aby se autoři Unicode vešli do limitu 64k znaků (což se nakonec stejně nevyšli), tak CJK ideogramy "sjednotili", a code point (řekněme číslo znaku v sadě Unicode) zastupuje význam, nikoliv jeho grafickou reprezentaci, která se v jednotlivých kulturách liší. Například znak U+8349 (grass) má v čínštině a japonštině odlišnou grafickou reprezentaci. Totéž příklad v prvním linku. Podle všeho se to dá řešit přes variant selektory, pokud to podporuje font a pokud jsou použité v textu.
https://en.wikipedia.org/wiki/CJK_Unified_Ideographs#/media/File:CJKV_variant_glyphs.png
https://en.wikipedia.org/wiki/Han_unification
Aby to bylo zajímavější, tak některé běžné znaky mají přímo v Unicode i "národní varianty". Navíc to vypadá, že tradiční a zjednodušené čínské znaky mají vlastní code pointy, což je přesně opačný přístup (prý protože tradiční vs. zjednodušené znaky byly oddělené v kódových stránkách vytvořených ještě před Unicodem). Takže U+4E1F je totéž co U+4E22 z hlediska významu (discard), ale vypadá to jinak.
Z toho celého vyplývá, že vytvořit jeden font pro čínské, japonské, korejské a vietnamské ideogramy je nejspíš technicky nemožné. Znamenalo by to stovky tisíc grafémů (řekněme vektorových obrázků).
Jako vtip dobré - teď už jen přesvědčit Unicode Consortium aby ze specifikace vyřezalo Čínštinu a další podobné jazyky a možná by to šlo - viz. http://stackoverflow.com/questions/13908639/does-arial-support-chinese-characters
Pozn.: IMHO žádný font na světě nepokrývá celé Unicode i když Noto to možná už zvládá nebo se tomu hodně blíží. A jak píši výše, tak většina fontových souborů ani nemůže podporovat více než cca 65 tisíc znaků. To že si dříve mysleli že to bude stačit je škoda.
Heh, jedna vec je počet nakreslených glyfov, druhá potrebné parametre na renderovanie... Bez vyladeného kerningu, polohy akcentov, definovaní ligatúr (niektoré sú dokonca samostatné znaky v Unicode) a pod. je sebelepšie písmo nečitateľné. Nehovoriac o veľkosti samotného písma. A pochybujem, že to vôbec dokázali vyladiť pre európske jazyky.