Nějaký neoficiální nekompletní seznam je třeba zde: https://github.com/spaze/domains
8. 8. 2023, 12:12 editováno autorem komentáře
Ano. Omlouvám se za svůj předchozí neúplný komentář, úplný seznam jmen delegovaných z .cz opravdu veřejně neexistuje.
Ale z mého pohledu tohle pseudo-skrývání dnes moc nefunguje, z mnoha důvodů. Váš dokaz to dobře ilustruje a je snadno použitelný kýmkoliv.
Na to, aby si člověk udělal statistiku s rozumnou přesností není aktuální přesný seznam potřeba. Speciálně bych vypíchl certificate transparency logs, protože téměř každá "používaná" doména bude mít TLS certifikát od uznávané autority pro nějaké jméno uvnitř. Různé zaparkované domény a podobné mi moc zajímavé stejně nepřijdou, ve statistikách akorát nafukují počty.
Ano, pseudoskryvani nefunguje. Zdroju clovek najde - kdyz chce - spoustu. Dokonce jsou ccTLD, ktere seznam registrovanych domen primo publikuji, viz napr. https://internetstiftelsen.se/en/zone-data/ ... a neprekvapive se zadna "tragedie" nekona. Aneb seznam zon by klidne mohl byt opendata... uzavrenost zrovna v tomto nic nezkomplikuje ani z pohledu ruznych "spekulantu", ti se o koncici domeny stejne perou... :-)
To, že jde o veřejná data opravdu neznamená, že nutně musí být zveřejněna v podobě ucelené databáze. Znamená to, že pokud je někdo využije i kdyby se k nim dostal neveřejnou cestou někde u piva, je to naprosto v pořádku protože jako taková ta data veřejná jsou.
Mezi veřejnými daty a zveřejněnými daty je poněkud rozdíl.
Téma této zprávičky je analýza obsahu veřejného DNS. Všechny pro tohle zajímavé záznamy (jako MX a adresy mail-serverů) ani přímo na serverech u .cz zóny nejsou. Jsou delegovány mimo cz.nic. Kdokoliv si tohle může nacrawlovat a zanalyzovat, dokonce i použitý SW je odkázán a open-source.
Tohle jen tak pro doplnění, kdyby se náhodou (někdo jiný) chtěl trochu zamyslet nad obsahem tohoto komentáře. EDIT: oops, nereloadnul jsem a tak se trochu opakuji.
8. 8. 2023, 11:06 editováno autorem komentáře
Data o MX záznamech jsou sice veřejná (kdo se na MX záznam zeptá, dostane odpověď), ale aby bylo možné udělat takovýhle přehled, musíte vědět, na jaké záznamy se máte ptát. Nebo-li potřebujete seznam domén v TLD .cz (ten veřejný není, ten má jen CZ.NIC) nebo monitoring dotazů na doménové servery TLD. cz (který má zase jen CZ.NIC) – přičemž ADAM pokud vím používá ten druhý způsob. Podobná data mohou získat velcí provozovatelé DNS resolverů (např. Google, Cloudflare, v ČR opět CZ.NIC) a velcí ISP (ti by to získali monitorováním DNS provozu v síti). O ničem z toho ale nelze říct, že by to byla veřejná data ve smyslu, že si odněkud stáhnu seznam aktivních domén v TLD .cz.
Rozhodně si nemyslím, že jde o nějaké šmírování, nepovažuju to ani za zneužívání dat. Ale to, že k tomu CZ.NIC využívá neveřejná data, to je pravda.
Nemyslím si, že k tomu CZ.NIC využívá neveřejná data
, pokud tím je myšlen seznam domén.
To, že jsou nějaká data (z principu) veřejná
, totiž neznamená, že je musíte dostat pěkně pohromadě v nějakém čitelném balíčku! Je spousta veřejných údajů, které takto pohromadě prostě nezískáte.
Kupříkladu: samotné jméno (příjmení) je také veřejný údaj, ale nikde nezískáte úplný seznam jmen všech obyvatel České republiky - ani na Statistickém úřadě. Stejně tak otevírací doba obchodů je veřejným údajem, zveřejněným i na dveřích prodejny, ale nikde není evidence všech otevíracích dob všech obchodů. Samotné číslo účtu je veřejný údaj, ale žádná banka nikomu neposkytne čísla aktivních účtů všech svých klientů.
Tedy bych to opravil: CZ.NIC využívá veřejná data, která má z principu k disposici jako pravděpodobně jediné
.
Ostatně: seznam platných registrovaných domén musí být natolik dynamický a proměnlivý, až věřím, že jakákoliv kopie bude nekompletní, protože se to změní během kopírování.
Chci tím říct, že než budete reagovat na nějaký komentář, máte si jej přečíst. Celý. Nepravdu jsem nenapsal. To, co vy jste sáhodlouze vysvětloval ve většině svého komentáře, jsem já napsal také, jenom stručněji. A na závěr jste uvedl nepravdu, přitom v mém komentáři jsou vyjmenované další subjekty, které mají k dispozici seznam vznikající prakticky stejným způsobem, jakým vzniká u CZ.NIC.
Vaše snaha opravovat nepravdy je chválihodná, ale ještě budete muset zapracovat na tom, abyste neopravoval věci, které jsou napsané stejně, jak je píšete vy; a neopravoval věci na nepravdivá tvrzení, když to máte v předchozím komentáři vysvětlené i s příklady, jak to je.
Pokud si tu doménu kupujete proto, aby vám ji někdo nevyfoukl (nebo ji nezneužil), nepotřebujete na ni hned vystavit TLS certifikát. Ten vystavíte těsně před tím, než vše zveřejníte. Zkrátka to, kdy se doména zveřejní, má v moci ten, kdo si jí registruje.
Navíc to rozhodnutí, že se seznam domén v TLD .cz nebude zveřejňovat, vzniklo dávno před CT.
(Pro jistotu – nejsem zastánce ani odpůrce zveřejňování seznamu domén. Vidím důvody pro i proti a nemám pocit, že by nějaké výrazně převažovaly.)
A tak ono je cela rada dalsich technik, kterak predmetna informace muze "utect". Nektere nabizi i primo registr, staci s nim trosku umet pracovat... a samozrejme jen zopakuji, ze spekulacim s registracemi (potazmo bojum o expirovane domenova jmena) ta uzavrenost beztak moc efektivne nebrani.
Ano, nektera rozhodnuti jsou historicka a dost mozna i prekonana - aneb je fajn obcas je projit, zrevidovat a zamyslet se nad tim, jestli skutecne plni sledovany cil, nebo jde jen o nejaky ekvivalent security through obscurity. Jako dalsi priklad takoveho historickeho rozhodnuti muzeme uvest treba IDN - ktere treba EU, PL ci DE bez vetsich zadrhelu podporuji, ale nekteri "zpatecnici" v Cesku se ho buhviproc stale boji ;-) I kdyz okolo naleznete spoustu prikladu toho, ze se zavedenim IDN se zadna tragedie nekonala.
a samozrejme jen zopakuji, ze spekulacim s registracemi (potazmo bojum o expirovane domenova jmena) ta uzavrenost beztak moc efektivne nebrani.
Děkujeme za osvětový příspěvek, který polemizuje s něčím, co nikdo netvrdil.
Jako dalsi priklad takoveho historickeho rozhodnuti muzeme uvest treba IDN - ktere treba EU, PL ci DE bez vetsich zadrhelu podporuji, ale nekteri "zpatecnici" v Cesku se ho buhviproc stale boji ;-)
Obávám se, že to není „bůhvíproč“, ale „CZ.NICproč“. „Informační a naprosto neutrální“ web háčkyčárky.cz totiž uvádí spoustu rizik, která už jsou dávno ošetřená nebo jejichž ošetření je v moci CZ.NICu. Nedivím se, že jsou pak lidé proti zavedení IDN v TLD .cz, když vidí tu domnělou záplavu negativ.
Mozna byste si mel lepe nastudovat zasady zpracovani osobnich udaju, tedy dokument ktery je nedilnou soucasti pravidel registrace. Asi staci kapitola 8, nez tu zacnete neco kvakat o nejakem zneuzivani. A kazdy uzivatel domeny zaregistrovane pod .cz s timto zcela dobrovolne souhlasi, ze? ;-) Ono bez toho souhlasu jaksi domenu nelze registrovat/prodlouzit.
Ale ono i CUZK publikuje statisticka data, ktera ziska z jinak ne zcela verejnych dat, ze? ;-) Kdyz jste u tech prikladu...