Když už se do toho CSNOG opřelo a chce zlepšit stávající stav, nebylo by principiálně lepší zkusit něco udělat přímo se zdrojem? Například vytvořit nějakou petici, aby publikovali soubor, který je opravdu strojově zpracovatelný? Nebo třeba obrátit se na někoho z Pirátu. Pokud vím, byli přizváni do nějaké komise, aby se podíleli na e-governmentu a myslím, že alespoň oni by tenhle nesmysl rozpoznali na první dobrou a měli by asi lepší páky vysvětlit to i té nejzabedněnější úřednické bedně ze všech nejzabedněnějších úřednických beden. Už jen číst o PDF formátu se strojově zpracovatelnou textovou vrstvou mi způsobuje psychickou bolest.
Kdyz pridaji do toho PDF souboru jeste QR kody, kodujici dulezite udaje, pro kazdy zaznam jeden QR kod, bude ten dokument strojove zpracovatelny? ;-) Pod pojmem strojove zpracovatelny soubor lze vymyslet cokoli... Pokud vim, ministerstvo slibovalo, ze oficialne publikovane PDF bude mit strojove citelelnou vrstvu, ale nevim zda to k necemu bylo.
Kdyz pouziji pdf2txt, tak vidim data "ve strojove vrstve", skutecne je to dost nepouzitelne. Mozna by sel napsat skrypt, ktery by pouzival heuristiku a data nejak logicky usporadal, ale bylo by to dost nespolehlive reseni. Neco podobneho delam treba pro bankovni vypis. Ceske banky jsou na tom podobne, mnohe neumi vygenerovat pouzitelny vypis pro strojove zpracovani, i to CSV ktere generuji je tragicke, takze je nakonec lepsi dolovat data primo z PDF vypisu :-(
Ono není vůbec jasné, kdo se do toho opřel. CSNOG není formálně vzato vůbec nic. Nemá to ani právní subjektivitu, těžko to může s kýmkoliv jednat. Aneb kdo vlastně zastupuje CSNOG navenek? Vždyť se ani neví, kdo přesně za tím stojí a koho by vlastně zastupovali.
Podle těch commitů v odkazovaném GIT repozitáři jde spíše o partizánštinu někoho z Cesnetu. V situaci, kdy se sám Cesnet z politických důvodů k autorství přiznat nechce. Ze strachu o granty, co je živí...