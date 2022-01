O konci cookies třetích stran se mluví už asi deset let, tvůrci prohlížečů postupně zpřísňují pravidla pro jejich použití a je jasné, že jim brzy bude úplný konec. Umožňují totiž unikátně označit uživatelův prohlížeč, což je pochopitelně trnem v oku zastáncům soukromí.

Reklamní trh ale podobný nástroj potřebuje, protože umožňuje cílit reklamu podle uživatelových zájmů. To je zase výhodné pro zadavatele a zároveň pro příjemce peněz – tedy pro vydavatele a provozovatele nejrůznějších webů. Cílená reklama jednoduše funguje lépe. Čtenáře Roota pravděpodobně více zaujme reklama na nový notebook než náhodně zobrazená necílená reklama na parfém pro ženy.

První pokus nevyšel

Google, jako tvůrce nejpoužívanějšího prohlížeče a zároveň provozovatel největšího reklamního systému, se snaží vymyslet přijatelnou náhradu. Ta první se jmenovala FLoC, tedy Federated Learning of Cohorts. Umožňovala uložit do prohlížeče informaci o „kohortách“, tedy jakýchsi uživatelských skupinách s podobným zaměřením. Tyto informace by pak byly na požádání předány jednotlivým webům, které by nad nimi prováděly vlastní analýzu.

Tento plán ovšem narazil na rozsáhlý odpor v celé komunitě, která zahrnuje další tvůrce prohlížečů, ale třeba i zástupce marketingových společnosti. Ti první kritizovali hlavně to, že kohorty neřeší hlavní problém cookies – soukromí uživatelů. FLoC totiž dokázal dodávat reklamním systémům podstatně více dat, protože je sbíral i na webech, kde tyto reklamní systémy neměly svůj kód. Navíc v kombinaci s dalšími identifikačními údaji mohla tato data vést k odhalení konkrétního uživatele.

Provozovatelé reklamních systémů zase poukazovali na to, že tento systém přesune ještě více kontroly do rukou Google, protože menší společnosti nebudou moci konkurovat svými analytickými nástroji těm velkým. Poukazovalo se rovněž na kolizi s GDPR, protože prohlížeč by o uživateli předával data různým subjektům, včetně Google.

Odpor byl skutečně velký, tvůrci ostatních prohlížečů prohlásili, že budou FLoC blokovat, k podobným krokům vyzývaly i různé organizace a projekty zabývající se soukromím uživatelů. Google proto musel přijít s něčím novým.

Nový recept jménem Topics

Google tedy přišel s novým nápadem s názvem Topics. Má řešit stejný problém: cílení reklam bez použití identifikátoru v podobě cookies třetích stran. Jde na to ale jiným způsobem než FLoC. Vše je založeno na seznamu zájmových témat, který se v prohlížeči vytváří na základě předchozí historie prohlížení.

Google jako příklad použitelných témat uvádí například auta, fitness, knihy, komiksy, kosmetika, rocková hudba, týmové sporty nebo vegetariánská kuchyně. Předpokládá se, že nabízených témat budou stovky až tisíce. Můžete si prohlédnout první sadu určenou pro testování.

Zásadní je, že se témata vybírají výhradně v prohlížeči a do procesu není zapojen žádný server ani služba. Informace o tématech jsou ukládány po dobu tří týdnů a poté je prohlížeč smaže. Pokud navštívíte web, který chce informace o uživatelových zájmech, prohlížeč mu předá tři vybraná témata – v každém ze tří týdnů vybere náhodně jedno téma z pěti nejnavštěvovanějších.

Výhodou tohoto systému má být také jeho průhlednost, protože se vše odehrává v přímo v prohlížeči. Uživatel bude mít možnost si svá témata zobrazit, některá smazat nebo celou funkcionalitu úplně vypnout.

Podstatné podle autorů je, že podle těchto obecných preferenčních informací není možné identifikovat konkrétní prohlížeč nebo uživatele. Použitelná témata jsou totiž velmi obecná a schválně nezahrnují citlivé informace jako je pohlaví nebo rasa. Reklamní systémy, jako příjemci těchto informací, tedy nebudou mít informaci o konkrétním identifikátoru prohlížeč, ale rovnou dostanou seznam zájmů.



Autor: Google Porovnání cookies s tématy zájmu

Smysl je takový, aby reklamní systémy dostaly informaci připravenou a nemusely se tak uchylovat k různým hraničním praktikám jako je třeba fingerprintig prohlížeče nebo nucené přihlašování na každé stránce pro udržení informace o uživateli.

Google má v plánu brzy spustit testovací režim pro vývojáře, kde bude možné si vyzkoušet uživatelské ovládání a zpřístupnit API pro načítání informací z prohlížeče. V plánu je teď posbírat informace a zpětnou vazbu k tomu, jak by měl celý systém nakonec vypadat.

Technické podrobnosti

Google podrobně popisuje celé rozhraní a princip výběru a předávání témat. Základem je javascriptová metoda document.browsingTopics() , která stránce vrátí pole tří vybraných témat. Algoritmus výběru přitom zahrnuje náhodu, kdy se z pěti nejnavštěvovanějších témat daného týdne vybere náhodně jedno. Existuje i pětiprocentní šance, že se z celé historie vybere úplně náhodná položka.

To vše proto, aby nebylo možné korelovat informace předávané několika různým spolupracujícím webům. Každá stránka dostane od stejného uživatele jinou kombinaci zájmů, takže není možné podle odpovědi říci, že jde o stejného uživatele. Vzniká tím také prostor pro věrohodné popření (plausable deniality).

Zajímavé také je, že odpověď na požadavek nemusí být vždy vyplněna či nemusí obsahovat všechny informace. Pokud totiž web v minulosti nevolal rozhraní API pro daného uživatele na webu o některém z témat, nebude toto téma zahrnuto do pole vráceného rozhraním. Cílem je zabránit přímému šíření uživatelských informací více stranám, než kolika informace předávají cookies.

Do výběru témat se budou také započítávat jen ty weby, které API používají. Tím se opět zužují místa, na kterých se sbírají informace o uživateli. Vedle toho budou zahrnuty pouze ty stránky, na které uživatel přišel na základě své vlastní akce. Nebudou se tak například počítat přesměrování.

Pokud si naopak web nepřeje být započítáván do témat a nechce se celé věci účastnit, může to prohlížečům oznamovat pomocí HTTP hlavičky:

Permissions-Policy: browsing-topics=()

Témata budou vybírána na základě doménového jména navštěvovaných webů. Google plánuje sám vytvořit model, který bude přiřazovat jednotlivé weby k tématům. Tento model bude veřejně dostupný a kdokoliv bude moci zkontrolovat, jaká témata jsou k jeho webu přiřazena. Vývojáři chápou, že výsledná data nebudou dokonalá, ale bohatě postačí, pokud budou dostatečně relevantní pro běžné cílení reklam.

Spousta nedořešených otázek

V dokumentech zveřejněných vývojáři Google je zmíněna celá řada otázek, na které ještě musejí být nalezeny odpovědi. Jednou z nich například je, zda budou moci provozovatelé stránek zasahovat sami do toho, jaká témata jsou s nimi spojena. Jak to mají dát vědět? Jak budou tato data zahrnuta?

Otázkou také zůstává, co se stane, pokud nebude provozovatel spokojen s tím, jak je jeho web tématicky zařazen. Pokud by například doména Root.cz byla mylně označována jako web týkající se zahradničení kvůli slovu kořen v názvu. Vadí to vůbec? Je to pro provozovatele problém?

Vlastně není ještě vůbec jasné, kdo a jak by měl udržovat seznam témat. IAB Tech Lab vytváří seznam zhruba 1500 různých témat zájmu, Google jich zatím do testovací sady vybral 350. Je potřeba opatrně pracovat s tím, jaká témata v seznamech jsou, aby nebylo možné skutečně uživatele dělit podle ničeho jiného než zájmů. Která témata jsou ale vlastně citlivá? Nezávisí to také na regionu? Nejlepší by bylo, aby byl seznam veřejně dostupný a udržovaný mimo vývoj prohlížečů samotných. Kdo to ale bude dělat?

Mají mít vydavatelé možnost sami, třeba pomocí metadat v hlavičkách, informovat prohlížeč o tom, jaká témata se týkají daného webu? Co by měl ale dělat provozovatel všeobecného zpravodajského portálu s tisíci články na všechna možná témata? Jak by měl prohlížeč zareagovat, pokud by bylo takové rozhraní zneužíváno?

Topics API rozhodně není hotová věc, která je připravená k okamžitému nasazení. Google s ním vyšel na světlo světa poměrně brzy, jako spíše s návrhem řešení situace, kdy nebudou mít provozovatelé webů k dispozici cookies třetích stran. Spoustu věcí je potřeba doladit a odpovědět na některé fundamentální otázky. Ještě důležitější ale je, zda toto řešení přijmou také ostatní tvůrci prohlížečů a reklamní trh.