Před cca rokem a půl jsem dostal pozvánku na Facebook se seznamem několika lidí, které znám. Pak jsem dostal ještě několik 'upomínek', které již obsahovaly více lidí, které znám.
Zajímavé je, že to mnohdy zřejmě byli lidé, které by znala ta, která mi tu pozvánku poslala, neznala. Trošku jsem zkoumal, jak se Facebook mohl tyto informace dozvědět. Nabízí se jednoduchá možnost - tito lidé v minulosti hledali můj (neexistující) účet na Facebooku podle e-mailové adresy. Tak jsem se pár lidí zeptal. Odpovědi si již napamatuji, ale tehdy jsem skončil se závěrem, že to asi nebyl jediný zdroj inforrmací, který Facebook použil.
Možná mě někteří z nich hledali jen podle jména. Ale to by samo o sobě nestačilo - spojit moji e-mailovou adresu s mým jménem není (snad) úkol pro dnešního robota, s tím mají problém i někteří lidé. Tuto souvislost by tedy taky musel Facebook někde zjistit.
Nabízí se tu, že někdo (kdokoli) mě na Facebooku hledal podle jména a po neúspěšnčém hledání podle e-mailu. Na základě tohoto by šlo spojit jméno a e-mailovou adresu. Problém je v kvalitě dat: tyto závěry nelze vyvozovat úplně obecně. Navíc člověk podle mého názoru v situaci, kdy hledá lidi jen tak, bude hledat více lidí a pak není úplně jasné, která adresa patří komu. (Tady by šlo moje jméno spojit s adresou vylučovací metodou.) Navíc nevím, kolik lidí to takto dělá. A navíc: jméno není unikátní identifikátor. Sice nejsem Jan Novák, ale moje jméno taky není na světě unikátní...
To by dávalo smysl. Jenže:
I toto není úplně kvalitní zdroj dat, dostal jsem pár takových e-mailů, přičemž ostatní jsem naprosto neznal. Ale já sám jsem takové maily neposílal, takže z toho lze těžko soudit, s kým se znám. (Navíc mám pocit, že někteří to posílají klidně úplně neznámým lidem.) A nejsem si jist, že by šlo e-mailem vyřešit úplně všechny. Těch navržených lidí nebylo až tolik (dost možná ale jen Facebook nechtěl poslat těch informací co nejvíc, ale snažil se vybrat jen pár nejzajímavějších), ale byli dost různorodí.
Dobrý den,
to, o čem mluvíte, využívá FB již velmi dlouho. Říká se tomu "social engineering" a je to souhrn sociologických technik, které jsou dnes již automatizovatelné a vytváří takzvané "Sociální mapy". Je to na základě poměrně nenáročných matematických modelů.
Ve zkratce se dá říct, že v momentě, kdy Vám byl odeslán e-mail kterýmkoliv účastníkem sítě, vzniklo jednoznačné spojení jména a e-mailu (které bylo považováno za 100%tní výchozí bod). V zápětí se projede posledních X postů daného uživatele a oscanuje se, kdo na ně reagoval. Prověří se spojení mezi těmito lidmi (podobné LIKE na FB, podobné skupiny na FB atd.) a takto se postupuje tak dlouho, dokud se nenajde úroveň, kdy je pravděpodobnost spojení s původním uživatelem příliš malá.
Odtud vzniklo i to, že podle Vašeho názoru osoba, která Vám zaslala e-mail, o těch lidech neměla "ani tušení". Prostě s nimi měla veliký koeficient podobnosti a bylo možné je přes určitý počet tzv. "úrovní" spojit. :)