Pokud by náhodou něco takového prošlo, toto by mohla být dobrá zábava: Vezmete binárku s tím client-side filtrem, reverznete jí, nejspíš to bude nějaká neuronka, vygenerujete pro ní adversarial examples (vstupy, které ji trigrují, ale jsou objektivně zcela neškodné), a pak s nimi zahltíte, co se dá. *EVIL GRIN*
Co jsem četl, tak to nemá být nějaké neuronkové rozpoznávání obrázků, ale porovnávání hashe odesílaného obrázku s hashi v databázi policie, což mi teda přijde docela zvláštní, protože to zachytí jen to, co už policie někde zachytila, ale hlavně to znamená, že policie někde takovou databázi udržuje, z čehož vystávají otázky, kdo k tomu má přístup atd.
Typicky je ovšem nějaký kompromis mezi false positives (s jakou pravděpodobností to trigruje nesouvisející obsah) a false negatives (jak snadno jde upravit obsah tak, aby už ho hash nepoznal). Zvlášť, pokud mám hashovací algoritmus k dispozici a můžu párkrát zkusit, co na něj zabere a co ne, může být nalezení správného evasion relativně jednoduché (byť ne tak jednoduché, jako obfuskovat ten soubor, aby se tvářil jako random binární blob).
Hledejte pojem Digitální vodoznak. Je to vlastně opak hashe - při změně výchozího dokumentu se změní jen málo, a tak stále poskytuje původní informaci. A může přežít i změnu barevné hloubky, ořezy, ...
Jak to funguje? To je velmi jednoduché: nemám tušení a byl bych rád, kdyby mi to někdo dokázal vysvětlit.
Současný návrh počítá nejenom s porovnáváním hashu, ale i detekci nových obrázků / videí pomocí natréhovaného AI modelu, který budou dodávat nejpravděpodobněji soukromé firmu typu Thorn a podobné. Co se týče vytváření hashu samotných, tak se jedná o úplně běžnou praxi v podání buď přímo policie nebo nevládních organizací (ECPAT), které pro to dostaly povolení. Původní obrázky a videa mají k dispozici pouze na omezenou dobu a poté je mají smazat. Existuje mnoho případů, kdy materiál zaměstnanci těchto subjektů buď sami shromažďovali nebo i přeprodávali dál.
len ci to nieje pozostatok z doby ked to zacali pripravovat a vtedy este take neuronove siete ktore by to vedeli robi proste dostupne neboli, resp. nebolo by ich realne nasadit v takom meradle
ja som presvedceny, ze nad tymto sa uz uvazovalo dlhe roky a preto sa tam spomina z dnesneho pohladu tak primitivna technologia, ale ked sa to raz schvali, tak zmenit technologiu uz bude uplna malickost. tam uz nebudu potrebovat schvalovanie v rade eu, ani v eu parlamente, to bude uz cisto technicka otazka
Nejde o kryptohash. ale PhotoDNA (v případě obrázků), což je trochu složitější.
Z netechnického pohledu máte pravdu, to, kdo a jak tu databázi definuje je podstatný problém - díky tomu, že je neveřejná je riziko zneužití k další agendě téměř jistota.
https://blog.cryptographyengineering.com/2019/12/08/on-client-side-media-scanning/
16. 9. 2025, 16:08 editováno autorem komentáře