Háčky a čárky jsou v url jsou prostě zbytečná blbost. Navíc vznikne problém, že pokud někdo bude chtít v zahraničí do browseru vložit českou url s háčky/čárky tak to nedokáže. Musel by totiž kvůli tomu procházet znakovou sadu a hledat vhodný "char". Kdo někdy pracoval v zahraničí nebo tam používal počítače ( vznikne nutnost nastavit v OS klávesnice CZ) tak ví o čem mluvím. Pro ostatní národnosti to prostě bude dost problém. Stejný problém jako kdybychom my zkoušeli zadat url v arabských/čínských/japonských znacích(klikyhácích).
Obyčejný charset z ANSI bohatě stačí. Těmito blbostmi z toho akorát vytvoří zbytečný babylon.
"pokud někdo bude chtít v zahraničí do browseru vložit českou url s háčky/čárky tak to nedokáže"
Jenže spoustě místních firem je zahraničí doslova ukradené. Půjčovně vozíků s krajským rozsahem je nějaký cizinec prostě ukradený.
V Římě buď Římanem. Ten argument že pro cizince to bude těžké a že se jim musí všechno usnadňovat taky neuznávají všude v zahraničí. A netřeba jezdit daleko, Francie je tím pověstná. Nebo - měsíc zpátky jsem na největším madridském nádraží řešil, že jen některé automaty na jízdenky umí anglicky.
Babylon už tu máme. Od té doby, co pralidé opustili Afriku. Zakrývat před tím oči nemá smysl.
Ten podmiňovací způsob není na místě. IDN tu dávno máme, máme i české domény s diakritikou, jen ne v doménách druhé úrovně v .CZ. Přesně o tom je tenhle článek.
Čili pokud nějaké problémy s IDN existují, máme je už teď. Já jsem třeba nikdy nebyl v situaci, kdy bych byl v zahraničí a trápila mě nemožnost zapsat japonskou IDN doménu. Není to jen virtuální problém?
Neni to virtualni. Ja jsem v zahranici a na firemnim pocitaci nemam CS klavesnici a uz leta ji nepouzivam. A treba zrovna registrace na root chce zapsat slovo s diakritikou. Chvili jsem premyslel, ze se na to vykaslu a pak jsem to dlouhe mekke i zkopiroval z jinych stranek, na ktere se bez diakritiky dostanu. Takze za virtualni to pokladaji akorat ti, kterym to nevadi. Bylo by fajn respektovat i nazory lidi, kteri to nechteji a ne se je snazit za kazdou cenu presvedcit o sve jedine pravde (neni mireno na nikoho konkretniho).
6. 1. 2020, 10:10 editováno autorem komentáře
Jenže spousta vlastníků domén to už teď nerespektuje a nikoho se neptají. Třeba doména lepší.tv je dobrou ukázkou. České domény s IDN tu dávno máme, bez ohledu na nějaký výsledek průzkumu.
Nikoli, je to dobrá ukázka, protože právě takhle by to v nejbližší době v doméně .cz vypadalo. Nikdo neočekává, že by někdo používal jen IDN variantu, bez ASCII. Co z toho mají? No úplně tu základní věc, že když propagují lepší.tv nebo košík.cz nebo živě.cz, tak uživatel může prostě napsat tuhle doménu a nemusí přemýšlet nad tím, že ale když je to doména druhého řádu pod .cz, tak musí háčky a čárky odstranit.
"uživatel [...] nemusí přemýšlet nad tím, že ale když je to doména druhého řádu pod .cz, tak musí háčky a čárky odstranit"
Ne, uzivatel musi premyslet jenom pri diakritice. Nektere TLD IDN nezavedou a stejne je to s nekterymi provozovateli webu, ergo TLD neni vyjimecna. Pri tvrzeni "Nikdo neočekává, že by někdo používal jen IDN variantu, bez ASCII" to bude bez diakritiky fungovat a s diakritikou jak-kdy.
"živě.cz"
Jo, to se zrovna hodi. Je to zive.{sk,cz} a pri diakritice se to lisi. To jen aby to nebylo matouci.
Nazor lidi je ale vyjadrovan jen skrze statisticky prepocet osloveneho vzorku, ktery je interpretovan jako nazor naprosto vsech.
Respondentu v zasade moc nebylo - 1 023 z 1 879 oslovenych organizaci (kterych je radove milion), 1 213 z 2 249 oslovenych uzivatelu (z nekolika milionu uzivatelu - lidi v produktivnim veku) a... nejzajimavejsi cilovka... jen se 437 z 1 022 oslovenych drzitelu domen (kterych je celkem 526 tisic).
To rovnou muzete se stejnou "logikou" udelat volby, jeste se usetri. Median, CVVM a Kantar vystrihnou pruzkumy a podle toho obsadime radnice, krajske urady a parlament :-) CZNIC takto postupuje cele roky. Uz jsem psal vyse, zrovna udelat pruzkum skutecne mezi vsemi drziteli (potazmo registrovanymi kontakty) formou jakesi online ankety - kde kazdy obeslany drzitel bude identifikovan nejakym jedinecnym identifikatorem platnym prave pro jednoho drzitele - domen zadny zvlastni technicky problem neni - ale nic takoveho se doposud nestalo. Pokud muzou tu a tam dorazit emaily pozadujici overeni kontaktnich udaju, je mozne zrovnatak obeslat drzitele s pruzkumem. Vysledek by byl rozhodne verohodnejsi, nez vsechny provedene pruzkumy na vybranem vzorku lidi.
> Nazor lidi je ale vyjadrovan jen skrze statisticky prepocet osloveneho vzorku, ktery je interpretovan jako nazor naprosto vsech.
Ano, tento obor se jmenuje statistika a je poměrně exaktní.
> Respondentu v zasade moc nebylo - 1 023 z 1 879 oslovenych organizaci (kterych je radove milion), 1 213 z 2 249 oslovenych uzivatelu (z nekolika milionu uzivatelu - lidi v produktivnim veku) a... nejzajimavejsi cilovka... jen se 437 z 1 022 oslovenych drzitelu domen (kterych je celkem 526 tisic).
A na průzkum tohoto typu je takováto velikost vzorku naprosto dostačující.
Mohl bych poprosit všechny, aby si nejprve otevřeli alespoň základy statistiky, než se začnou opírat do konstrukce průzkumu?
> To rovnou muzete se stejnou "logikou" udelat volby, jeste se usetri.
Danny, prosím nedělej ze sebe hlupáka, díky.
437 z 1 022 oslovenych drzitelu domen (...) A na průzkum tohoto typu je takováto velikost vzorku naprosto dostačující.
A kolik bylo těch, kterých se IDN týká? Bez této informace podle mě nejde dobře vyhodnotit to, co se z této ankety vyhodnotit snaží.
Před dvaceti lety by podobně dopadl dotaz "Chtěli byste mít v autě systém, který by za vás udržoval odstup od jiného vozidla, automaticky brzdil v omezení rychlosti, před překážkou a hlídal jízdu v pruhu?". Dnes by tato anketa dopadla taky odlišně u respondentů, kteří s takovým autem už jezdili a u těch, kteří o tom jen čtou v časopisech. Stačily jen bouře při povinném zavádění ESP (systém, co se mi plete do řízení!).
Podobných příkladů z praxe můžeme najít mnoho: chtěli byste jezdit vlakem / metrem bez strojvedoucího? Chtěli byste letět letadlem, které samo přistává a pilot jen sleduje?
A přesto posléze nikdo nepochybuje, že je to přínosem.
Jenze ja poukazuji hlavne na to, ze CZNIC ma prostredky, jak se dobrat k vyrazne presnejsim cislum. A dost mozna i levneji. Ale chapu, ze to videno byt nechce a radeji se z lidi s odlisnym nazorem delaji hlupaci ;-) Podobne pruzkumy na omezenem vzorku jsou vzdycky zatizene nejakou chybou a i praxe uz ukazala, ze realne vysledky se mohou na hony vzdalit vsem provedenym pruzkumum (mimojine prave u tech voleb).
> IDN tu dávno máme, máme i české domény s diakritikou, jen ne v doménách druhé úrovně v .CZ.
Přesně. A kdo z vás se kdy potkal s nějakou reálně používanou doménou třetí (nebo vyšší) úrovně s diakritikou? Já si tedy žádný případ vybavit nedokážu. To o "potřebnosti" IDN vypovídá mnohem více, než nějaké teoretické úvahy.
Každá nová věc potřebuje impulz, aby se rozhýbala. Dokud se nezavedou IDN v TLD CZ, pochybuji, že to někdo bude řešit ve třetím řádu. Je spíš trendem smrskávat služby do druhého řádu (viz implicitní vynechávání "www." v prohlížečích, v reklamách atd.). Tento impulz nevyřeší trh (IDN nelze pořídit ani za větší peníze), ale pouze rozhodnutí CZ.NIC.
To není dobrý argument. Protože obecně je snaha mít krátké názvy webů, takže pokud možno jen druhá úroveň. A ze zahraničních webů používáš pouze ty mezinárodní, právě pro to že v zahraničí jsi cizinec.
Ale až budeš chtít navštívit nějaký web místního pekaře v druhém největším brazilském městě, tak se s takovou stránkou třeba setkáš.
O potřebnosti IDN nemá rozhodovat CZ.NIC, ale majitel příslušné domény. Celá debata není o tom, že by mělo být IDN v TLD .cz povinné. Jde o to umožnit používat IDN těm, kteří to budou chtít používat. A pokud jich bude jen pár, tím lépe pro odpůrce IDN – alespoň se s tím reálně nesetkají a nebudou mít důvod si stěžovat.
Mimochodem, některé reálně používané domény jsou napsané v článku. Další je třeba https://lepší.tv. A pak je také zaregistrovaná doména ulož.to, kterou ale vlastní někdo jiný, než uloz.to – a na tom je dobře vidět nevýhoda toho, že IDN v TLD .cz není. Tváříme se tu, že žádné IDN neexistuje, zatímco všude kolem nás funguje – tím pádem české subjekty nemají dostatečné znalosti a nechají se na tohle nachytat (primárně provozovatel, který si tu doménu nepohlídal).
" a na tom je dobře vidět nevýhoda toho, že IDN v TLD .cz není"
s/nevyhoda/vyhoda/
Lide pouzivaji domeny bez diakritiky. Ondrej Caletka si muze dat na subdomenu diakritiku, ale nemuze cekat, ze lide budou zkouset diakritiku prvni. A mame domeny s www, bez www, v budoucnu mozna s diakritikou a bez a zkouset vsechny je na prezdrzku.
Jsou lidé, kteří se v jednadvacátém století nenaučili psát s diakritikou ani příspěvky.
A mame domeny s www, bez www, v budoucnu mozna s diakritikou a bez a zkouset vsechny je na prezdrzku.
Podle mě žijete mimo realitu spotřebitele. V reklamách se už dnes nikde nepoužívá www. Máme seznam.cz, root.cz, rohlik.cz. Www si případně doplňuje prohlížeč, pokud někdo nemá dost rozumu mít naked verzi nastavenou (a nejlépe i preferovanou).
Naopak školou prošlý člověk umí psát na počítači a zcela instinktivně píše rohlík.cz, nikoliv rohlik.cz. Odháčkování a odčárkování je uměle vytvořený návyk, pro který dnes už neexistuje žádné odůvodnění.
Omezení bylo dříve dáno úrovní techniky - ale taky kdysi nešly posílat obrázky v mailu a velikost příloh byla omezená. Podpora těchto vlastností přinesla určité komplikace, ale nikoho ani nenapadlo, že by to zakázal a držel se starých pořádků.
A zkoušet všechny kombinace? Jsme zpět u toho, že je v zájmu poskytovatele služby, aby si určil jak to bude mít podchycené. Rohlik.cz by si podle mě zaregistroval rohlík.cz, ale určitě ne róhlik.cz.
Jsou lidé, kteří se v jednadvacátém století nenaučili psát s diakritikou ani příspěvky.
Kdyby diakritika vzdy fungovala, tak bych ji pouzil a propagoval. Ona nefunguje a punycode z hlavy nedavam. Rozbite ISO8859-1 nebo ansii je horsi nez text bez diakritiky.
Treba tohle nebezi:
$ whois háčkyčárky.cz % Whoisd Server Version: 3.12.0 %ERROR:108: invalid request % % Invalid character in request, request not properly terminated or too long.
V reklamách se už dnes nikde nepoužívá www
Nepouziva, ale nekteri lide to tam pisou. A nektere stranky bez toho nefungujou. Takhle mame 4 varianty na zkouseni, mozna vice, viz zive.sk / zive.cz, ktere se s diakritikou lisi.
Www si případně doplňuje prohlížeč
Ne, to si prohlizec nemuze jenom tak doplnit.
Naopak školou prošlý člověk umí psát na počítači a zcela instinktivně píše rohlík.cz, nikoliv rohlik.cz
Kdyz se povoli "divoke" IDN, tak instintivni zapis mozna povede k phisingove domene. Tedy chvili se mozna bude vracet 302, ale kdyz si lide zvyknou, tak to zacnou proxit. U rohlik.cz to treba tolik nevadi, csob.cz je horsi. Kdyz se vam dnes vrati chyba, tak alespon vite, ze je neco spatne.
Bez diakritiky sam pisu z vlastni lenosti / pohodli, ale to fakt neimplikuje, ze bych mel v dnesni dobe neco proti IDN jako takovemu - v dnesni dobe, s dnesni technologii, s dnesni urovni poznani. Ano, jsem ze stare skoly, co pamatuje Kameniky/CP852/KOI8CS/ISO8859-2/CP1250 a to peklo s konverzemi mezi, ktere v mezicase postupne diky UTF upada v zapomeni a ktere hromada lidi uz proste ani nezazije.
Primo URL dnes lidi zapisuji malokdy (kdyz presne vedi, po cem jdou a nebo pisou email nekomu mimo svuj bezny address-book) - ale casto beztak skonci u nejakeho vyhledavace. Vzdyt uz i prohlizece jsou koncipovane tak, ze primo z adresniho radku provedou vyhledani, pokud je zadano neco, co zjevne URL neni...
Proste ta "hysterie" kolem IDN mozna mela smysl v roce 2010, ale v roce 2020 to fakt uz zadnej logickej smysl nedava, a data z okolnich registru to - ke smule CZNIC - potvrzuji.
@Filip Jirsák
"Proč by ten e-mail ondřej@caletka.cz neměl fungovat? Není lepší, než uživatelům vysvětlovat, co všechno nebude fungovat, prostě opravit software tak, aby splňoval aktuální standardy? Pak to fungovat bude…"
Jenomže v zahraničí skutečně kadí na české znaky, často ví o českém písmu tolik co Vy o thádžikistánském. Ano, můžete mít pro každou zemi zvlášť email a nebo celému světu vysvětlovat že jejich software nesplňuje standardy, musí opravit software a kdoví co ...
Jenže takové weby je už nyní nutno považovat za porouchané. IDN funguje na jiných TLD, v Česku funguje od třetího řádu. Takže diakritika se v e-mailu za zavináčem objevit může a web by to měl umět zpracovat. Pokud neumí, je to podobný prohřešek, jako kdyby nepočítali s tím, že v e-mailové adrese může být pomlčka (resp. rozdělovník), tečka, plus atd.
Příklad s "ondřej@caletka.cz" nebude problém, protože každý snad ví, jakou má svoji e-mailovou adresu a jakou mu poštovní služby dovolily založit.
Ne, neni to jako s pomlckou. Pomlcka se muze vyskytovat v emailove adrese odkdy email funguje. Kdyz bude email adresovan na muj email a k nek.do-jiny@example.com, tak budu mit temer jistotu, ze email alespon me prijde. Kdyz tam bude neco s hacky a carky, tak to muze nefungovat s kazdym MTA na ceste, ktere nezna IDN. A IDN musi znat i postovni klienti.
To se neda zarucit a vyzadovat.
MTA o IDN vůbec nic vědět nemusí. V e-mailové adrese je doména zakódovaná v ASCII pomocí punycode. Pokud jde o lokální část adresy, to s IDN nijak nesouvisí. A opět je to stejné řešení, jako u čehokoli jiného – buď to MTA umí a projde to, nebo je to nějaká věc, kterou neumí, a pak ohlásí chybu a e-mail se vrátí jako nedoručitelný. Ale MTA, který by neuměl UTF-8, už dnes nepotkáte – a měl byste s ním problémy stejně, bez ohledu na e-mailovou adresu.
Kdyz bude email adresovan na muj email a k nek.do-jiny@example.com, tak budu mit temer jistotu, ze email alespon me prijde. Kdyz tam bude neco s hacky a carky, tak to muze nefungovat s kazdym MTA na ceste, ktere nezna IDN.
Vůbec ne. IDN funguje tak, že jsou národní znaky kódované do ASCII. MTA si nemá čeho všimnout.
Ne, lidé používají domény IDN. Domény bez diakritiky používá pár lidí – 10 milionů v ČR a pak pár dalších. To, že jsme v ČR v něčem pozadu a lidé to neznají, opravdu není výhoda.
A mame domeny s www, bez www, v budoucnu mozna s diakritikou a bez a zkouset vsechny je na prezdrzku.
To by byl dobrý argument, pokud by si vlastník domény sám nemohl rozhodnout, že použije i ASCII doménu i IDN, a že použije i www i bez www. Jenže takové omezení nikdo nechce.
Ci to nebude tym ze Japonci IDN velmi nepouzivaju (menej ako 10% domen: https://jprs.co.jp/en/stat/), aby predisli problemom ...
To není žádný virtuální problém. Evidentně si nikdy nepoužíval počítače v knihovnách, internetové kiosky v zahraničí příp. exotických oblastech( blízský východ, asie, apod.. ). Prakticky ani mail v českém charsetu prostě nenapíšeš. Dobří admini mají zablokované i instalace klavesnice a hledat každý znak tabulce znaků to je vyloženě "super" nápad.
Mimochodem internet je tu s námi již 25 let a nepotřebovaly jsme to. A přiznejme si upřímně kde byl v roce 1995 a kde je nyní. Pro rozvoj sítě je tato věc naprosto nepodstatná. Český charset v url je tudíž naprosto nepotřebná.
Je evidentní, že se zjevně někdo nudí (např. lidi v nic.cz ) a nemají roupama co skutečně chytrého a užitečného dělat. Možná by stálo za to věnovat se radši efektivnějšímu, hospodárnějšímu chodu nic.cz i za cenu propouštění, snižování nákladů a rušení nepodstatných projektů, které se správou domény cz nemají co společného.
technomaniak: Mohl byste být konkrétnější? Kdy konkrétně jste se s tím problémem setkal, když není virtuální? IDN už tu máme dlouho, IDN jsou přímo v TLD, ve spoustě generických domén, v národních doménách, v doménách třetí úrovně. TLD .cz bez IDN je dnes spíš výjimka. Takže pokud to není virtuální problém, musíte se s tím potkávat docela často. Jak často se vám třeba za poslední rok stalo, že jste chtěl napsat IDN TLD, třeba Hongkongu? Kolikrát jste psal latinkovou IDN? Můžu hádat? Nula, že?
Navíc nikdo neříká, že by nebylo možné dál používat a registrovat ASCII domény. Takže to, jestli použije nebo nepoužije IDN, by bylo jen na vlastníkovi domény. Zakázat používat IDN v doméně nemůžete ani dnes.
1) Dobře nějaký ten pátek jsem z Evropy nevylezl ale to nemění fakt na to, že kdysi jsem s tím na jiném kontinentu měl prostě problém. Český charset prostě může být velmi složité na cizích počítačích v cizích zemích používat.
2) Samozřejmě jsem přečetl co říkal, Krčmář, že už to vlastně funguje. Vůbec taková blbost neměla být implementována. Mimochodem, nějak jsem si nevšiml, že by to lidi nějak vyžadovaly. Tak to totiž bývá u lemplů, iniciativa lemplů vždy vyšumí do ztracena, protože je to hloupé a nikdo to nechce. Mnohem výhodnější je, když lemplové radši nic nedělají - aspoň neplýtvají zdroje, které mohou být využity jinak a efektivněji.
3) Samozřejmě můžeš argumentovat, že v zahraničí používáš vlastní mobil/ntb apod.. Ale to nemění nic na tom, že někdy prostě musíš použít cizí stroj.
Já netvrdím, že někdo chce zrušit url bez háčků/čárek. To prakticky ani není technicky možné. Jde jen o to, že prostě napojení ze světa může být pak mnohem zbytečně komplikovanější, pokud by se tohle šílenství rozšířilo.
Ad 1) To, že budete mít problém na cizím počítači zadat české znaky, to nikdo nerozporuje. Akorát to vůbec nijak nesouvisí s IDN, takže nechápu, proč se to pořád dokola opakuje. Za prvé, v drtivé většině případů by vlastník té IDN měl udělané přesměrování z ASCII domény. To řeší váš problém. Kdyby náhodou to přesměrování udělané neměl, prostě ten název zadáte do Googlu. Opět to vyřeší váš problém. A i kdyby to přesměrování neměl a vy jste neznal Google ani žádný jiný vyhledávač, je to pořád chyba toho jednoho provozovatele webu, není důvod kvůli tomu zakazovat IDN všem ostatním. Navíc ten zákaz v .cz vás před ničím neochrání, jak je uvedeno v článku, IDN už dávno existují a používají se.
Ad 2) Funguje to a žádná blbost to není. Je logické, že když se něčí rodný jazyk zapisuje v čínských znacích nebo azbuce, chce ve stejných znacích zapisovat i domény a nechce používat žádnou latinku, která pro něj nic neznamená. Smysl to dává i pro češtinu – prostě ty znaky s háčky a čárkami používáme v českém jazyce, je logické, že je budeme používat i pro domény. V článku jsou příklady firem, které mají své názvy jako internetové domény, a samozřejmě je propagují jako česká slova, protože jenom ta mají pro lidi význam. Lidé nevědí, co je „rohlik“ nebo „kosik“, ale „rohlík“ a „košík“ znají. A když se propaguje „rohlík.cz! nebo „košík.cz“, proč psát do prohlížeče něco jiného? Mohou k tomu být nějaká technická omezení – ale ta už dávno neplatí. Dnes je to omezení čistě administrativní.
A že to moc lidí nevyžaduje? To ale přece ničemu nevadí. Kolik lidí vyžaduje 63znakové domény? Přesto jsou podporované. Těm, kteří chtějí dlouhou doménu nebo IDN, je možné vyhovět, a ostatním to nijak neublíží.
Ad 3) Ano, to nikdo nerozporuje. Akorát to nijak nesouvisí s IDN, viz bod 1.
Hodne odvazne tvrzeni. Predstavte si pane ze nemate jazyk s fonetickym zapisem. A ze i clovek, ktery se v dane zemi narodil nevi jak presne danou vec napsat a potrebuje slovnikovou napovedu.
Dost casto se stava ze clovek zna slovo, vi jak ho rici ale totalne nevi jak nakreslit/napsat. Nebo si uvedomi tak 4 ruzne varianty jak by se to dalo asi napsat.
A pak kterou abecedou to jeste napsat pokud se pouzivaji treba 3 znakove sady. Takze ten clovek radeji pouzije transkripci nebo zjednodusenou formu.
Ono je obcas lepsi vytahnout paty z ministerstva ....