Vlákno názorů ke zprávičce Ministerstvo financí zveřejnilo dvanáctou verzi blacklistu nepovolených hazardních her od andrej - "open-source automatický parser PDF dokumentů ministerstva s webovým...

Aktualita je stará, nové názory již nelze přidávat.

31. 7. 2019 16:14

andrej

"open-source automatický parser PDF dokumentů ministerstva s webovým rozhraním a API" ma dostal

ved naco robit za peniaze platcov dani nieco uzitocne ked mozeme vydavat informacie v neuzitocnej forme a zakonom zabezpecit ze aj tak to platcovia dani budu citat.

ale co, mozeme byt radi ze to nedavaju v jednobitovych tiffoch, ved to bol pred par desatrociami celkom pouzivany format.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2019 18:01

bez přezdívky

Spis se divim, ze se z toho delala takova afera. To pdf zvladne rozparsovat kazdy za 2 minuty.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2019 21:50

bez přezdívky

No ale přeci jen zde máme spoustů jiných formátů daleko vhodnějších pro strojové spracování než pdf. Nadruhou stranu většina úředníků je spíše zvyklá na práci typu vytiskni a přepiš, kde to pdf dává smysl.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 10:24

bez přezdívky
kdo to chce zpracovávat strojově, tak to zvládne za pár minut a nemá potřebu se rozčilovat. Podle mě to řeší manažerské typy, kteří mají potřebu prokazovat, že jim to politicky myslí (nadávat na Babiše).

jde využít datumů za doménou

import re from subprocess import check_output def domains(pdf): txt = check_output(['pdftotext', pdf, '-']).decode() domain = r'[\w\.\-]+\.\w{2,4}' date = r'\d{1,2}\.\d{1,2}\.\d{4}' return re.findall(f'\n({domain})\n\n{date}\n', txt)
1. 8. 2019, 10:25 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 10:27

L.

Stříbrný podporovatel

A jakou máš garanci, že ti to bude fungovat i na další verzi toho seznamu?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 10:41

bez přezdívky

ten změněný seznam začne platit hned po zveřejnění? Na změnu skriptu mám dost času.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 10:47

Ondra Satai Nekola

Zlatý podporovatel

To musí být super, když ti pak lidé volají na dovolenou s těmihle hloupostmi.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 10:48

bez přezdívky

lhůta na změnu je určitě delší než délka běžné dovolené.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 10:53

Ondra Satai Nekola

Zlatý podporovatel

"určitě"?

Je to 15 dnů, takže ne, není.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 11:10

Filip Jirsák

Stříbrný podporovatel

Takže máte automatický skript, který musíte neustále hlídat, zda funguje správně, a každý jeho výstup ručně zkontrolovat a schválit? Nebylo by rychlejší to rovnou udělat ručně?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 10:27

Ondra Satai Nekola

Zlatý podporovatel

Pro to nadávat na Bureše je důvodů tolik, že další není potřeba.

To je moc hezké řešení. A teké moc křehké.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 10:43

bez přezdívky

určitě by to šlo vylepšit, aby to bylo neprůstřelné.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 10:46

Ondra Satai Nekola

Zlatý podporovatel

Nešlo.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 14:55

L.

Stříbrný podporovatel

Stačí, aby někoho napadlo převést text v tom PDF do křivek a jsi v p**** jak Baťa s dřevákama. To bys musel dělat převod PDF na bitmapu, z ní nějaké inteligentní OCR... ale nikdo ti stejně nezaručí, že se v polovině tabulky neobjeví text "Domény pod tímto nápisem ignorujte".
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 11:06

Zdeno Sekerák

Politiku bych sem radeji netahal o kdyz nas to s... vsechny.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2019 9:56

kmarty

Ta afera, pokud vim, teprve zacne az se zacnou odstranovat domeny ze seznamu. Protoze tehdejsi tvrzeni bylo, ze ta domena z toho listu nezmizi, jen se "zacerni" ci co. A teprve v tu chvili budu zvedavy na automaticky parser se 100% zarukou spolehliveho rozparsovani.

Vlákno názorů ke zprávičce Ministerstvo financí zveřejnilo dvanáctou verzi blacklistu nepovolených hazardních her od andrej - "open-source automatický parser PDF dokumentů ministerstva s webovým...

Dále u nás najdete

Zdravotnictví v roce 2026: bílé plomby na pojišťovnu a prevence

Nejmenším dětem mrkev vůbec nedávejte, mohou ji vdechnout

Města, hrady, hory: poznejte zasněžené dominanty

Lehké silvestrovské pomazánky, které budete mít za chvilku hotové

Teplý čaj i kulich. Kardiolog radí, jak připravit srdce na chlad

Příspěvky pojišťoven 2026: Více peněz na očkování i pohyb

Chystá se právo na opravu. Co nám přinese v praxi?

Daně 2026: Výhody pro startupy, družstevníky či majitele akcií

Cestovní náhrady a náhrada nákladů při práci z domova

České čipy v roce 2025: Špičkový čip z Prahy jde do výroby

Abyste drželi krok v 2026, musíte umět pružně pracovat s daty i AI

Co popřála k Vánocům a novému roku vláda na sítích?

Přinášíme 10 zajímavých příběhů podnikatelů za rok 2025

Rok 2025 ve startupech: Češi si věří jako globální hráči

Špehování konkurence: Jak najít slabiny a vytěžit z toho maximum

Vánočnímu vysílání vládly pohádky ČT s miliony diváků

Šest užitečných funkcí Chromu, které snadno přehlédnete

eGovernment 2025: eDoklady a digitalizace „pod Babišem“

Euforie z AI naráží na tvrdou realitu kybernetických hrozeb

Bitcoinoví těžaři uzavřeli nejúspěšnější rok v historii