Ale tohle vsechno funguje jen za velmi specifickych laboratornich podminek na definovanem hw s sw konfiguraci ze?
Protoze tech promennych je tolik ze na masivni nasazeni to neni prakticky pouzitelne.
Ta neuronka asi udělá hodně. Ale stejně bych měl pochybnosti - pokud ten prohlížeč není jediným procesem v systému, tak bude přesnost měření nepoužitelná.
Je to klasicka statisticka anlyza, akorat z v tomhle pripade bude chyba hooodne velka.
Oni proste vychazej z toho, ze kdyz ... tak se cumis na youtube, protoze na to cumej prece vscihni. Akorat ze ty se muzes cumet na neco uplne jinyho, coz uz se nijak nepozna.
Navic " který komunikuje s OPFS (origin private file system), což je přidělený úložný prostor vyhrazený pro konkrétní webovou stránku"
Fakt? A kde je receno, ze to bude na disku?
koukněte na ten paper, ono je to o tom, že ten youtube (teda skripty na něm) generuje určitý charakteristický průběh vytížení systému/disku, který jde pak statisticky (tou předtrénovanou neuronkou) s poměrně vysokou pravděpodobností (jestli koukám dobře tak 80-90%) matchovat.
Takže ne, pokud to chytne pattern youtube, tak to není čumění jinde (leda by jinde z youtube ukradli komplet scripty)
Čekal bych, že ve všech realistických scénářích ano, už proto, že ten pattern googlího šmírovacího ekosystému bude v superpozici s víc různými aplikacemi...
Znova ... jak docilis toho aby to vubec nejak hrabalo na disk? Odpoved je, ze vubec nijak. kazda svepravna aplikace, kazdej svepravnej sytem, kazdej pouzitelnej filesystem (a hromada dalsi vrstev) si to budou drzet v ram.
Dale, pattern cumeni na yoube bude viceme identickej jako pattern cumeni na twitch a atd atd atd. Guufli smirovaci scripty najdes na kazdym mainsteam webu,takze je od sebe taky nijak neodlisis.
Ano, několik GB v RAM. Pak otevřu 30 stránek a klekne mě comp (nedej bože pokud budu mít ty entry-level železa co mají ztěží 8GB). To je ale nápad!
Mě zaráží, že JS lze použít k tomu aby si stránka něco zapsala na disk. Vím, že máme cookies a další věci, ale toto mě teda děsí.
Webové aplikace no. Přístup k disku a HW (web-usb,serial,bluetooth...) je jedna z podmínek aplikace. Nemůžete DB, grafické soubory a další ukládat do cookies. K uživateli na disk se dnes ukládají i 4GB AI modely...
Mně hlavně není jasné, jak může webová aplikace zajistit, aby se data opravdu zapisovala na disk, když je mezi ní a tím diskem celý stack cachujících vrstev. Vždyť i aplikace, které to legitimně potřebují (třeba databáze kvůli transakcím nebo žurnálovací filesystémy), trpí tím, že dnes se obecně nedá spolehlivě zajistit, že dostanu potvrzení až ve chvíli, kdy jsou data opravdu fyzicky zapsaná na médiu.
Nemůže. Ale to tady není až tak důležité, protože to celé vypadá jako postavené na timingu těch IO volání a tedy je to analýza ve stylu "teď se tam asi hromadí požadavky" nebo "teď se to asi fláká".
Jenze je to postaveny na tom, ze disk ma nejakou, radove vetsi, latenci. Navic nejtypictejsi situace bude takova, ze nedefinovatelna cast dat bude v ramce, a dalsi nedefinovatelna na disku. Coz se jako bonus bude v ramci sekund menit.
Příklad:Mega(upload). Ten nejdřív stáhne soubor kamsi na disk, pak se teprve objeví nativní prohlížečovo dialog o stahování a soubor se stáhne vysokou rychlostí z vašeho disku na váš disk do místa, kam si zvolíte (nebo kam je nastaveno stahování, nemá-li se prohlížeč ptát).
Tam se to takhle z principu chová kvůli možnosti (de)šifrování souboru až v prohlížeči, aby Mega neměla v ruce během procesu šifrování v ruce klíč, ne? Což by mi zcela výjimečně přišlo jako příčetné použití.
Jak velký soubor? To, že si nejdřív soubor stáhnu do blobu v operační paměti (nevím teda, jestli prohlížeče bloby někam neoffloadují ale velikost dostupné paměti se uvádí jako běžný limit) a pak ho předám uživateli (který ho pak vidí jako soubor ke stažení) je celkem běžná technika.
29. 5. 2026, 10:50 editováno autorem komentáře
Tohle dělá i s gigabajty. U hodně velkých fajlů to chce native klient, tam si s tím browser vždycky měl problémy.
Rozpoznávání uživatelů podle otisku prohlížeče nejde vyřešit technicky. Vždycky, když se jedna možnost zalepí, objeví někdo pět dalších.
Tohle jde ošetřit jedině legislativně. Naštěstí drtivá většina těch, které by takové techniky mohly zajímat, je z EU legislativně postižitelná (pro uživatele z USA nebo Kanady je postižitelná z jejich zemí).
Ono ale ničemu nevadí, když se to bude dít – ve velmi omezené míře. Pokud to bude dělat nějaká obskurní stránka s pěti přístupy za den, není to problém. Problém by byl, kdyby to dělaly velké reklamní systémy, sociální sítě, e-shopy apod.
Koukal jsem na to a x.com vykazuje znaky používání této analýzy. Např seznam Google nebo Facebook to nepoužívá.