blacklist.salamek.cz maji funkcni parsovani pdf, jen nemaji...

Článek je starý, nové názory již nelze přidávat.

1. 8. 2017 10:39

Rada (neregistrovaný)

Na https://blacklist.salamek.cz maji funkcni parsovani pdf, jen nemaji hotove overovani podpisu
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2017 11:25

Bystroushaak (neregistrovaný)

+1, podrobnosti zde: http://www.abclinuxu.cz/blog/salamovo/2017/7/czech-blacklist-info-page-api
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2017 13:40

Filip Jirsák

Stříbrný podporovatel

Funkční parsování PDF, které umí spolehlivě parsovat jenom ta PDF, která už byla dříve zveřejněná, je k ničemu. Potřeba by bylo umět parsovat i PDF, která se mohou objevit v budoucnosti, a to nikdo nenapíše, když není vůbec nijak specifikován formát dat. Je velmi odvážné (a to je ještě mírně řečeno) tvrdit o něčem, že je to funkční parsování, když k dispozici nemáte žádnou specifikaci a máte jenom jeden jediný vzorek.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2017 14:18

Bystroushaak (neregistrovaný)

Proto je to celý web, který předpokládám bude spravovaný lidmi. Vzhledem k tomu, že na implementaci mají poskytovatelé vždycky asi 14 dní, tak mezi tím někdo stihne upravit parser / přidat tam ten job ručně.

Tím nechci tvrdit, že je tenhle přístup správně, samozřejmě, že to už mělo být ve strojově čitelném formátu. Ale momentálně je to dobrý nástroj, který ušetří opruz těm, kdo se tím nechtějí moc zabývat.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2017 15:20

Filip Jirsák

Stříbrný podporovatel

Není jednodušší ten záznam při změně prostě zkopírovat ručně, než to stejně ručně kontrolovat a pak případně upravovat parser? Já vím, že chyba je primárně na straně MF, ale připadá mi, že je zbytečné řešit nějaký parser, na který se stejně nedá spolehnout. Spíš bych řešil jenom údržbu toho seznamu ve strojově čitelném formátu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
2. 8. 2017 8:22

Petr M (neregistrovaný)

Ale on ten parser nejspíš bude fungovat tak, že někdo vloží soubor a texťák, co má být na výstupu. Soubor se zahashuje, hash se použije jako klíč v DB a přidá se ten text.

Uživatel nahraje soubor, spočítá se hash, jeho hodnota se zkusí najít v databázi. Buďto tam je a vrátí to text, nebo není a vrátí to chybu...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2017 16:10

Ondrej (neregistrovaný)

Jestli se jako ISP budes spolehat na to ze komunita do 14 dnu vzdy ten parser opravi, tak jste blazen. Ano par blokovanych webu se treba vzdy parser fixne, ale casem to upadne do zapomneni... Reseni je jednoduche, spojit se a vydupat si strojove zpracovane data. Ne tohle.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 8. 2017 16:14

Ondrej (neregistrovaný)

a jak na to koukam, a jestli si to autor webu cte, bylo by fajn pri nezdarilem parsovani vyhodit nejakou chybu napr na sentry, takhle se o tom nikdo moc nedozvi ze neco selhalo a nepodarilo se vyparsovat.

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Jak blokujeme nepovolené hazardní weby od Rada - Na https://blacklist.salamek.cz maji funkcni parsovani pdf, jen nemaji...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Google Pixel 10a má plochý design a vylepšenou odolnost

Příspěvek na produkty spoření na stáří a daň z příjmů

Plánované změny v penzích: Zjistili jsme další podrobnosti

Malware, ransomware a další online hrozby: Jak se liší?

Domén s koncovkou .CZ přibývá, většina je podepsaných

Notepad++ opravil chybu zneužívanou k šíření malware

Fenomén sociálních sítí: Od studentského seznamování k debatám o bezpečnosti

AMD přichází se značkou Ryzen AI do segmentu stolních počítačů

AI se snaží promlouvat i do stavebnictví

T-Mobile má za sebou v tuzemsku pozitivní rok, rostly tržby i zisk

Zahrávají si ČEZ či E.ON s čínským ohněm?

Nedostatek vitaminu D se projeví únavou i špatnou náladou

Irsko se po pauze znovu otevírá pro výstavbu datových center

Spropitné v restauracích se nebude muset danit ani evidovat v EET

Proč mají vysavače mikrofony? Omylem ovládl tisíce vysavačů DJI

AI prolomila celou firemní infrastrukturu za 21 hodin

Připravit, pozor, teď! Spouštíme Channeltrends Awards 2025

Český startup ukazuje, že na AI modelech lze vydělávat

V čem se EET 2.0 liší od EET 1.0? Přinášíme velké srovnání

Majetkové přiznání dalo ministrům současné vlády zabrat