Inu proto, ze programatori aplikaci jsou lini, nectou moc specifikace (RFC) a strci tam nejaky jednoduchy test opreny o regular na zakladni veci obsahujici jen pismena, cisla a tecku, aby se nereklo. Pro mnohe je sproste slovo treba i IDN a k nalezeni jsou i omezeni na prostou delku, kdy je vynucovana delka adresy kratsi nez povoluji standardy (ala system 50 znaku vam musi stacit).
Bohužel na každém místě projde něco jiného a je spousta míst, kde neprojde ani adresa na doméně 3. řádu.
Protože mě takovéhle případy dost nas***jí, tak jsem kdysi hledal regex, který by to dokázal zvalidovat správně. Našel jsem jeden, co pokrýval téměř kompletně specifikaci, ale vypadal spíš jako zašifrovaná slohová práce než regex.