http://www.yoynam.sk/ dlhodobo vyuziva zmatenie z povodne nemeckeho qwertz rozlozenia
Celkem jednoduše ta doména se začne objevovat třeba v podvodných emailech, to by mohlo stačit, já neříkám, že registrátor má takové domény aktivně hledat, ono stačí až by je nahlásil některý z národních cisrt teamů místo toho, že na své stránky do novinek napíšou pozor na emaily od .... vedou na podvodné stránky.
Ano to by byl ideální stav, ale to jaksi nefunguje.
Úplně ideální by byla kombinace, snažit se o odhalení při registraci a v případě, že už se něco stane tak na to reagovat blokací.
Jinak proto jsem navrhoval veřejný blacklist, ze kterého by mohly čerpat jiní registrátoři. Také by se hodil na vytvoření algoritmů pro odchytávání i při registraci.
Jakmile to budete porovnávat ručně, bude to drahé a neprůhledné. Neustále se s váma někdo bude soudit, proč jste tohle povolil a tohle nepovolil. Neustále to někdo bude zkoušet – tohle neprošlo, tak zkusíme něco mírně odlišného. Ne, takhle by to nikdy fungovat nemohlo.
Jediné, co může fungovat, jsou jasně daná pravidla, která půjde algoritmem vyhodnotit. Unicode je jasně definovaná znaková sada, význam každého znaku je v ní definován, znaky jsou rozdělené do různých skupin. Takže není problém nadefinovat pravidla, která z toho budou vycházet. Třeba i s tím, že se nejprve definují velmi restriktivní pravidla (jen jedna skupina znaků na doménu, úplně se vyloučí používání znaků, které vypadají jako ASCII znaky apod.).
Sofistikované útoky jsou vedené proti konkrétním cílům, takže nemůžete spoléhat na to, že se to provalí kvůli masovému používání. Když si zaregistrujete doménu аррӏе.com, pošlete na ní odkaz jedinému člověku, po úspěšném napadení zrušíte delegaci DNS serverů a za rok ji necháte propadnout, nikdy se na tu doménu nepřijde.
Proč by se to porovnávalo v nějakých fontech? Já jsem psal o Unicode znacích. Na to, že „CYRILLIC SMALL LETTER A“ asi bude vypadat stejně, jako „LATIN SMALL LETTER A“, nepotřebujete žádné zobrazení. A pokud už chcete něco porovnávat vizuálně, ty znaky máte zobrazené ve standardu, to je směrodatné. Třeba tu cyrilici najdete zde: http://www.unicode.org/charts/PDF/U0400.pdf.
Osobně si myslím, že registrátor by neměl odchycovat vůbec nic, zavádí to do systému nedeternimistický bordel a subjektivní posuzování. Jedná-li se technicky o různé domény, pak různými jsou (bez ohledu na překlepy či fonty) a je každého volba či blbost, zda si vybere doménu, ke které se dobře dělají domény podobné. Vedle toho má být uživatel zřetelně upozorněn (v prohlížeči, nyní už i v emailu) na skutečný (technický) zápis domény (který je jediným správným). Není možno donekonečna řešit problémy za líné lemply.
Osobně si myslím, že registrátor by neměl odchycovat vůbec nic, zavádí to do systému nedeternimistický bordel a subjektivní posuzování.
Není žádný důvod, aby to bylo subjektivní a nedeterministické. Současné pravidlo v TLD .cz, že nelze registrovat IDN, je deterministické a není subjektivní. Bylo by takové i předpokládané pravidlo, že IDN variantu domény může zaregistrovat jen vlastník odpovídající ASCII domény (která vznikne deterministicky tím, že se z IDN varianty odstraní veškerá diakritika). Stejně se dají definovat pravidla i pro generické domény, a v diskusi byly návrhy uvedeny.
Vedle toho má být uživatel zřetelně upozorněn na skutečný (technický) zápis domény
Uživatele technický zápis domény nezajímá a nerozumí mu. Technika je od toho, aby řešila potřeby lidí, ne od toho, aby se jí lidé přizpůsobovali. Stejně tak byste mohl chtít, aby se uživatelům zobrazoval skutečný (technický) zápis webové stránky, tj. HTML kód.
... jak si má registrátor prohlížet PDFko?
Cože, proč by si měl PDFko prohlížet registrátor? To je snad naprosto zřejmé, že ke grafické podobě znaků se dá dostat i jinak, než otevřením jednoho konkrétního PDFka. A jejich podobnost může posuzovat program při <b>sestavování</b> tabulky podobných znaků. Tedy při <b>kompilaci</b> nástroje, který by identifikoval homografní domény.