Na druhou stranu mi asi nevadí, když to pošle domů moji HW konfiguraci, pokud nepůjde do detailů typu SN. Stejně tak mi asi nevadí, když si pošle seznam nainstalovaných balíčků. Chápu, že je na to někdo přecitlivělý. Sám jsem vcelku paranoidní, ale tohle je za mě asi akceptovatelné. Nepoužívám Fedoru, myšleno obecně.
Posle to tvoje IPcka, posle to seznam tvyho HW, SW, jeho nastaveni ... treba i seznam souboru na disku/sitovych sharech ... mac adresy, klidne kompletni arp ...
Pricemz jediny duvod proc to chteji, je prave to soukromi ti vzit. Zadne technicke vyuziti to totiz nema.
Mimochodem, tohle je jeden z duvodu, proc pouzivat cracknuty SW. Ten totiz nic neposila. U spousty games je v posledni dobe modou ti to uz nedovolit ani vypnout, coz je sice v cely EU ilegalni, ale kdo by to resil ze ...
IP adresa tam tak nějak z povahy věci bude. Můžeme se bavit o tom, jestli se bude ukládat či nikoliv, ale v dostupných datech bude. Pak je to otázka důvěry, jestli protistrana tu adresu opravdu ukládat nebude.
EDIT: Ale i tak tam může být spousta údajů, které uživatele celkem jednoznačně identifikují.
7. 7. 2023, 18:19 editováno autorem komentáře
Ale i tak tam může být spousta údajů, které uživatele celkem jednoznačně identifikují
Identifikace je zjištění totožnosti. To, že je daná kombinace hardwaru a nainstalovaných balíčků unikátní, ještě neznamená, že podle toho zjistíte totožnost uživatele. Docela by mě zajímalo, jakým způsobem byste jen na základě dat, které to má sbírat, jednoznačně někoho identifikoval.
Fedora už počítá unikátní instalace, aniž by používala unikátní identifikátory. Prostě jednou týdně se přidá informace do requestu na mirror.fedoraproject.org. S tímto řešením holt musíte věřit, že se jedná o unikátní hlášení. Systémy jsou nastavené tak, aby to unikátní hlášení byly a myslím, že nikdo nemá moc motivaci to nějak obcházet.
Idealni by by bylo kdyby se dalo presne definovat co chci posilat a jeste se dalo do systemu na tvrdo nastavit co nikdy, ani kdyby cert na koze jezdil, posilat nechci nebo chci nejaka data anonymizovat.
Uvedu trivialni priklad. Vyvijite / uzivate zarizeni ktere je pomerne malo uzivane ale uz ma pridelene sve ID a v reportu se ukaze. Ma k nemu pristup nebo ho vyviji pomerne omezeny okruh lidi. Profiltrovanim dalsi konfigurace uz jste schopen dohledat cloveka nebo velmi zuzit okruh jen na par lidi.
Celou vec vidim i z druhe strany. Kdyz se zeptam produktoveho vyvoje na cem vlastne ten hnuj ( nase spatne navrzena neskalovatelna aplikace ) bezi, nikdo poradne neodpovi ani ramcove. Support / PO maji data 8 let stara a jen ze to zakos nekde dobrovolne uvedl.
To same kdyz jistemu buildu umiraji sitovky a nikdo nevi co to je za znacku a jaky maji fw.
10. 7. 2023, 11:10 editováno autorem komentáře
A jak se ke me dostala tvoje zprava i presto, ze z ni IP nezjistim? To je jeden ze zpusobu, dalsi je, ze docela hodne pocitacu posilajicich telemetrii muze byt disconnected od internetu. A dalsi - na co je ti IP kdyz se s kazdym posunem pocitace presunu na jinou Wifinu? (treba vcera u me 3x - moje Wifi, na konci zahrady pouzivam nejakou volnou kdovi od jakeho souseda :), potom na androidim hotspotu).
Tohle přesně ukázka totálního nepochopení. Jsi snad správce root.cz? On totiž ten co ty data sbírá má pod kontrolou i ten server kam se to odesílá.
To, že se IP mění podle toho kde se člověk připojí je právě ještě horší, protože podle toho může zjistit kde zrovna je, když se spolu s daty posílá ještě unikátní identifikátor.
jj mám pocit, že se nechápeme, tak to zkusím rozepsat na dva "use case"
1) my jakožto zajišťovatelé podpory zákazníkům sbíráme jen nezbytná data. Ta zákazníci mohou vidět, je to z důvodu proaktivního supportu (ideálně tak, aby se chyba identifikovala ještě než nás zákazník zkontaktuje - to mají rádi všichni, jak zákoš, tak support) a samozřejmě je to opt-in. Z tohoto pohledu (a z toho co jsem psal výše) nás třeba IP absolutně nezajímá, takže se striktně (a nepřesně!) anonymizuje už na straně zákazníka.
2) ale určitě existují i "špatní sběratelé telemetrie", kteří s tím chtějí zákazníka sledovat pro nějaké nekalé účely. Tady samozřejmě závisí od toho, komu důvěřuješ a komu ne*, jak je telemetrie nasazena, jak je transparentní, jak se dá zapnout/vypnout a co vůbec zákazníkovi přináší, když si ji zapne.
* je to zajímavé, ale ve státech si firmy více důvěřují (až mě to někdy dost děsí); tady se buď nedůvěřuje by default nikomu nebo naopak úplně všem
Tak ještě jednou, jak se ta IP anonymizuje na straně klienta? Protože to je podle mě totální blábol. Jedině že by ty data někdo posílal třeba přes Českou poštu. Nějak se ty data k vám dostat musí a dost pochybuji, po tvých komentářích, že to není přes IP.
To, že vás nyní IP nezajímá vůbec neznamená, že v budoucnu bude, protože přijde nějaký manager co dostane nápad ty data dále prodavat.
Po zkušenostech s Avastem opravdu nikomu nevěřím a hlavně komerční firmě.
Ale nikdo vůbec netvrdí, že si ji neposílají v telemetrických datech, ale nějak se k nim ty data musí dostat a v tom příchozím spojení ta IP určitě je. Příjemce nemá jak ovlivnit, že tam ta IP adresa není a kdykoliv se může rozhodnout, že si jí spolu s daty uloží. Můžeš klientům poskytnout VPN/příze, ale zase tam je ta IP adresa, kterou si můžeš logovat.
Ne opravdu jim to nevěřím, protože mě napadá jediný způsob, jak při odesílání telemetrie nemít tu IP adresu. Opravdu nejsem tak padlí na hlavu abych uvěřil, že jí anonymizují na straně klienta a když mi někdo něco takového tvrdí, tak bych mu opravdu žádná telemetrická data neposílal.
Proste ve vsech vysbiranych datech se IP anonymizuje. Je to napsano dost nestastne regexpem, ale staci (spis to "sezere" nekdy i nejakou vec, co neni IP, tedy aspon teoreticky). Porad si nejak nerozumime, tak jeste jednou - JAK se data poslou (a pres jakou IP) neni relevantni, protoze spousta tech stroju je proste disconnected od Internetu, takze se to preposila pres takove chytrejsi jakoby proxy/agregatory. V tech datech zadna IP neni a ze to pristlo z 123.234.0.1 vubec nic nerika o tom stroji (ten se pochopitelne podepisuje jinak, takze MAME unikatni identifikator, jinak nema smysl nic posilat ;)
Hele never, to je naprosto v pohode a chapu to (jako skutecne chapu, akorat ve statech si firmy veri vic, proto cely nas IT sektor vlastne jeste funguje). Takze predpokladam, ze BIOS a drivery ke vsemu mate nekomercni a tak...
Proste ve vsech vysbiranych datech se IP anonymizuje.
Díky za potvrzení, že tu IP máte a nic vám nebrání to v budoucnu změnit tak, že se IP nebude anonymizovat.
Když ale máte IP té proxy, tak můžete poznat, že ten stroj patří do téhle skupiny, protože máte IP a unikátní identifikátor a podle té IP ty stroje zgroupovat. Pak vám stačí vědět, že jeden ten identifikátor pochází od jedné firmy a rázem víte, že všechny ty stroje v té skupině patří téhle firmě. Netvrdím, že to je nějaký obrovský bezpečnostní problém ale taky bych netvrdil, že se taková data pak nedají zneužít. Například můžete té firmě nabídnout nějaký produkt např. když používají MongoDB tak jim zkusíte nabídnout support na to MongoDB nebo MongoDB Atlas. Tohle lze krásně zpeněžit.
Já s tím nemám vůbec problém a ani pro mě není problém, že tam ta IP je. A ani nejsem nějaký fanatik, že bych chtěl všechno anonymizovat atp. Problém ale mám, když mi někdo tvrdí, že IP anymizuje na straně klienta, když to evidentně není pravda.
Já jsem ti dal důkaz, že se na straně klienta ta IP adresa neanonymizuje. Nastiň alespoň jak to děláte, že přijímáte data, kde ta IP adresa není v protokolu.
to samozrejme je pravda, to je to prave misto. Chapeme se v tom, co znamena anonymizovat IPcka? Myslim ze moc ne.
Spíš nechápeš o co mi celou dobu jde a proč to píšu. Neanonymizujete IP adresu na straně klienta. Sám jsi to tady i potvrdil (to, že klient používá svojí proxy nebo VPN rozhodně není vaše anonymizace na straně klienta). Klidně jí můžete anonymozovat na straně serveru (to ti věřím a určitě to děláte), ale to je opravdu jedno, protože na straně serveru to klidně můžete kdykoliv změnit. Vůbec nejde o to co vám někdo posílá v datech ale o protokol, kde ta IP adresa odesílatele je už z podstaty protokolu. Takže to, že to IP adresu neposíláte přímo v telemetrických datech neznamená, že na serveru ta IP adresa odesílatele, díky přenosovému protokolu, není.
Linuxovej desktop data potřebuje. Rozhodovat se podle ábíčka je špatný.
No, popravdě zrovna informace o nainstalovaných balících mi přijde výrazně citlivější než informace o hardware. Jaký mám procesor, množství RAM, rozlišení monitoru... to bych snad neměl problém poskytnout i neanonymně. U seznamu nainstalovaných balíčků by se cukal podstatně víc, protože to by o mně také mnohem víc prozradilo.
Zrcadla nemusí být zas až takový problém, protože jejich seznam a kdo se kam bude připojovat je asi v distribuci přednastavené, nebo to distribuce může ovlivnit. Takže třeba pro Českou Republiku by stačilo data ukládat na hlavním repozitáři a českém zrcadlu a budete mít celkem dobrý přehled kdo co má nainstalované v jedné zemi. Klidně můžete udělat nějaké pořadí mirroru a preferovat ty co ty data sbírají a až za ně dát ty univerzitní co ty data nesbírají.
Rek bych ze pouzvani soukromou osobou bude asi tak pravdepodobny, jako ze na ulici potkas duhovou vranu.
Jednak tux v domacnosti = tux v domacnostni ITka. Druhak se nadoma typicky mnohem castejs a pravdepodobnejs pouziva nejaky to buntu. Naopak, Fedoru bys velice pravdepodobne nasel v korporatnim prostredi.
Ono je taky rozdil mezi tim, zda-li je to opt-in (pojeti Debianu) a nebo opt-out (tak jak to zvazuje Fedora). Dokonce si v tom textu pani z RedHatu zduvodnuje, proc to ma byt opt-out a ne opt-in (ten ma zustat jen u upgrade, ze pry opt-in jsou zparchantele metriky) - a i tam to bude zparchantele tim zpusobem, ze lokalne se ty metriky zbirat budou (aneb dalsi bloatware)... cimz se to od toho Debianu lisi (tam se popcon proste nenainstaluje a ty data se nesbiraji ani lokalne, RedHat si v tomto zda se ponechava jisty backdoor). A vubec to tak nejak RedHat zda se resi systemem ala Windowze... ;-)
Opt-in vždycky znamená malý a zpravidla nereprezentativní vzorek. Když potřebujete vědět, kolik z uživatelů používá XY, jestli se tomu věnovat nebo ne, tak je k ničemu, když máte data ze vzorku jednotek procent uživatelské základny, který může klidně vykazovat chybovost (rozdílnost oproti skutečnosti) v řádu desítek procent.
Když se to v týmu řešilo, tak já jsem byl toho názoru, aby se žádná telemetrie nezaváděla. Cokoliv opt-out, je prostě rudý hadr, ať je to anonymizované a agregované, jak chce. Cokoliv opt-in, je zpravidla k ničemu.
Ano, rudý hadr to vystihuje dobře. Ještě je (byť taky otravná) možnost prudit uživatele při interakci s oním softwarem nějakým dialogem, dokud si nevybere, jestli se chce nebo nechce zúčastnit, podobně jako se slavnými cookies. Do té doby jednoznačně nic nesbírat a neposílat. Odhaduji, že by se tam dalo nasbírat (těžko říct o kolik) víc dat než při opt-in a i když by to lidi štvalo, necítili by zradu v tom, že se data implicitně sbírají bez jejich souhlasu.
Ono to není tak, že by to bylo po instalaci systému aktivované a uživatel na to nebyl upozorněný. By default to je vypnuté. Při prvním spuštění systému se spouští tzv. initial setup, což je série obrazovek, které uživatele provází úvodním nastavením systému, a na obrazovce s nastavením soukromí, kde už teď máme třeba souhlas se zasíláním informací o pádech, má být, jestli chce odesílat telemetrii. Opt-out vs opt-in v tomto případě je, že je ta volba by default zatrhlá a uživatel ji na té obrazovce musí vypnout místo, aby byla vypnutá a on ji musel zapnout. Bez schválení této obrazovky uživatelem se ale telemetrie nezapne. Aktivuje se to až v momentě, kdy tu volbu nechá zapnutou a dokončí initial setup. Proto se to třeba netýká již nainstalovaných systémů. U nich bude muset uživatel jít a explicitně to povolit v nastavení.
Ted jsem to chtěl napsat. To je totiž zásadní rozdíl mezi CCPA (který je opt-out) a GDPR (která je opt-in) Co je zajímavé a nutné říct, ze to eos-metrics provádějí IP geolokaci, také dělají statistiku jak dlouho user strávil v jakem programu, kdy šel system poprvé on-line, při každém dalším bootu posila geolokovany ping event. Jo a nemusím říkat že to je pomocí lib embedded přímo v GNOME Shell, jaká je konkrétní implementace ve Fedora netuším, jak moc kopírují implementaci EndlessOS.
Je to škoda. Fedora bola fajn distribúcia.
Ale niečo sa zlomilo.
Najprv: https://bugzilla.redhat.com/show_bug.cgi?id=1435968
Potom: https://bugzilla.redhat.com/show_bug.cgi?id=1979565
Au revoir!
Softwarové patenty se ve Fedoře řešily odjakživa. Vždyť tam nebývala ani podpora pro MP3 a prakticky žádné video kodeky. Proto taky existuje rpmfusion.
Blbé je, když to nějaký software neumožňuje obejít (konflikty souborů) a když si nějaký upstream přímo tu kontrolu vynutí v README no..
Já bych mohl přidat třeba https://bugzilla.redhat.com/show_bug.cgi?id=853998, který mě štve už deset let (to k tomu "byla fajn"). Jenže Ubuntu nechci a Fedora dělá spoustu věcí tak jak potřebuju.
Někteří maintaineři jsou prostě tvrdohlavější než jiní... a Jirka Eischman promine, zrovna desktop obecně a vývojáři z Gnome speciálně byli tvrdohlaví odjakživa co pamatuju :)
Ano, tahle argumentace kolem opt-in je videt uz z "originalu"... :-) Jako je jasny, co je "motivaci" - na zaklade podobnych dat rict, ze XYZ pouziva minimum lidi a pohrbit to.... jenze kde je problem? :-) Hromada veci se historicky zbesile patchovala a je to logicky z pohledu spravce distribuce dost tezko udrzovatelne. Mate na vyber ze dvou moznosti - snazit se minimalizovat ty "lokalni" patche a nebo danou vec proste "pohrbit". Ten problem s komplikovanou udrzbou mnohych baliku si distribuce dost casto... tak nejak vyrabi samy, ze? A jasne, mnohe veci jsou dedictvi minulosti.
A neteoretizuju, par distribucnich baliku jsem parkrat takto vzal - stylem, ze jsem proste jen potreboval build novejsi upstream verze. A prave na tech patchich si jde dost casto vylamat zuby.
Ja teda tu cestu nevidim v tom, ze se vyhazi "ne az tak oblibene baliky", ale prave v tom, ze se eliminuji ty home-made patche na mininum...
Tady nejde o to, co zahrnout do distribuce, ale o upstreamový vývoj. Třeba teď řešíme, jestli dál v gvfs podporovat Google Drive. Vyžadovalo by to nemalou investici do knihovny libgdata. Vůbec nevíme, kolik uživatelů to reálně používá a jestli má smysl to dál dělat nebo omezený čas věnovat raději něčemu jinému. S odpověďmi na tento typ otázek to má pomáhat.
Když bychom udělali dotazník, tak se tam nahrnou primárně lidi, kteří danou věc používají, a výsledky to zásadně zkreslí.
A ted si predstavte, ze byste chtel vyvijet neco zcela noveho... kde asi tak posbirate stejna data? ;-) To dopredu taky nezjistite, kolik lidi to doopravdy vyuzije. A i kdybyste udelali nejaky predbezny pruzkum formou nejake ankety, tak vam to nezaruci, ze lidi fakt vysledny produkt pouzijou. A ani pruzkum nad existujici knihovnou ne - muze se klidne stat, ze to tim vyvojem zmrsite tak, ze lidi se poohlednou po alternative (treba nejakem forku).
Snazite se ten vymysl z korporatu (kde nekdo muze vykazovat cinnost a moc se u toho nenadrit) obhajit hezky, ale ona by ta anketa pri aplikaci vhodnych statistickych metod udelala podobnou funkci. I s tou vasi telemetrii (taky vyvoj - bloatware, na to cas je?) zadnou zaruku lepsich dat nemate - zrovna Linux IMHO zvlaste na desktopech pouzivaj lidi, co ochranu soukromi resi vic... tedy ten magicky nove vyvinuty software na sber dat budou ve velkem vypinat...
Danny: Víte o tom, že vaše argumenty vůbec nejsou proti telemetrii? To, že průzkum před novým produktem se musí dělat jinak (dráž, méně spolehlivě) vůbec neznamená, že pro stávající produkty se to nemůže udělat levněji přesněji (telemetrií). Navíc vytvoření nového produktu je něco jiného, než zrušení současného – když nevytvoříte nový produkt, nikoho tím nenaštvete. Když zrušíte existující produkt, naštvete tím jeho uživatele a několik komentujících, kteří jej nikdy neviděli. Proto je docela důležité vědět, kolik těch uživatelů je.
zrovna Linux IMHO zvlaste na desktopech pouzivaj lidi, co ochranu soukromi resi vic... tedy ten magicky nove vyvinuty software na sber dat budou ve velkem vypinat...
Lidé, kteří doopravdy řeší ochranu soukromí, nejspíš nebudou mít důvod ten software vypínat. Vypínat to budou lidé, kteří dělají hlouposti a svádějí to na ochranu soukromí. A i kdyby to vypnulo 50 % uživatelů, pořád to bude dávat relevantní data.
ona by ta anketa pri aplikaci vhodnych statistickych metod udelala podobnou funkci
Tak nám ty vhodné statistické metody ukažte. Jak zajistíte, aby v té anketě rovnoměrně hlasovali ti, kteří produkt používají i kteří ho nepoužívají a neuděláte z jedné anketní otázky pětistránkový dotazník.
Lidé, kteří doopravdy řeší ochranu soukromí, nejspíš nebudou mít důvod ten software vypínat. Vypínat to budou lidé, kteří dělají hlouposti a svádějí to na ochranu soukromí. A i kdyby to vypnulo 50 % uživatelů, pořád to bude dávat relevantní data.
Můžete tohle tvrzení nějak dokázat? Z mého pozorování takovéhle věci naopak většina lidí v mém IT okolí skutečně vypíná. Já bych si klidně tipnul, že to vypne i 90% lidí. Navíc pokud budete chtít statistiku u nějakého pokročilého softwaru a většina jeho uživatelů bude mít telemetrii vypnutou tj. zrovna budou v těch "vašich" 50%, tak zjistíte akorát, že lidé co mají zapnutou telemetrii ten software nepoužívají, nic víc nic míň.
10. 7. 2023, 08:52 editováno autorem komentáře
Z mého pozorování takovéhle věci naopak většina lidí v mém IT okolí skutečně vypíná.
To ale neznamená, že tím opravdu řeší ochranu soukromí. Otázka je, jak relevantní vzorek je vaše sociální bublina.
I kdyby telemetrie nefungovala pro nějaký pokročilý software, pokud bude fungovat alespoň pro nějaké rozumné množství softwaru, dává to smysl. Není potřeba, aby ta telemetrie byla úplně dokonalá.
To ale neznamená, že tím opravdu řeší ochranu soukromí.
Myslím, že tohle je strašně subjektivní. Někomu nevadí, že má někde fotku, adresu rodné číslo a někomu vadí, když někdo ukládá data o jeho počítači (je mi jasné, že opět napíšete, že používá software Fedory a tedy jsou to Fedory pravidla, tak si to můžete rovnou odpustit, to je asi všem jasné). Rozhodně bych se nebál říct, že vy rozhodně nejste nějaký soudce z lidu, který říká co je soukromí člověka a co není, to může říct člověk jenom sám, kde tu hranici má.
Otázka je, jak relevantní vzorek je vaše sociální bublina.
Tomuhle já už říkám klasická Jirsákovina. Napsal jsem snad to snad jasně, že to je pouze mé okolí a pouze mé pozorování a pouze můj tip. Nic víc nic míň. Naproti vašemu, celkem sprostému, onálepkování lidí, kteří by něco takového vypnuli:
Vypínat to budou lidé, kteří dělají hlouposti a svádějí to na ochranu soukromí.
někomu vadí, když někdo ukládá data o jeho počítači
Jenže Fedora neví, komu ten počítač patří.
Rozhodně bych se nebál říct, že vy rozhodně nejste nějaký soudce z lidu, který říká co je soukromí člověka a co není, to může říct člověk jenom sám, kde tu hranici má.
V tom máte pravdu. Nicméně když ty údaje nedokážete přiřadit konkrétnímu člověku, není to soukromí člověka a nemůže si to říct ten člověk sám, protože nevíme, kdo to je.
Napsal jsem snad to snad jasně, že to je pouze mé okolí a pouze mé pozorování a pouze můj tip.
Tohle jste napsal jasně, ale pak jste z toho dělal dost odvážné závěry.
Naproti vašemu, celkem sprostému, onálepkování lidí, kteří by něco takového vypnuli
Kdybyste to nevytrhával z kontextu, nebude vám to připadat sprosté.
Mozna byste se mel namisto vaseho zvatlani zacist do reakci u zdroje a realizovat se se svymi moudry primo tam :-) Fedora ma povest distribuce, kde se na ochranu soukromi hodne dbalo, bylo to podavane jako soucast znacky.
Podle Vasi teorie by zjevne nemohl fungovat zadny pruzkum... :D No asi byste mel prestat fusovat do prace statistikum, kdyz jejich praci nerozumite... ;-) A nebo se jit aspon s nima poradit, nez zas placnete nejaky nesmysl do diskuze.
Fedora ma povest distribuce, kde se na ochranu soukromi hodne dbalo
Na té navržené telemetrii nevidím nic, co by do soukromí zasahovalo.
Podle Vasi teorie by zjevne nemohl fungovat zadny pruzkum...
Ale mohl. Jenže průzkum, který má sadu otázek, jeho vyplnění nějakou dobu trvá, účastníci se vybírají podle sociodemografických údajů a za čas strávený průzkumem získávají odměnu, je něco jiného, než jednoduchá anketa. Zejména cenově.
No asi byste mel prestat fusovat do prace statistikum, kdyz jejich praci nerozumite... ;-)
No evidentně jejich práci rozumím lépe, než vy, když vy byste si do ankety nějaké výsledky přičaroval. To, co popisoval Jiří Eischmann, totiž znamená, že už výběr respondentů ovlivňuje výsledek ankety – a to žádnou „statistickou metodou“ nezvrátíte. Ovlivnit byste to mohl jedině tak, že do té ankety vtáhnete lidi tak, že nebudou předem vědět, na co budou odpovídat. Taková anketa je podstatně náročnější a hlavně ji vyplní podstatně méně lidí.
Jak to vnimate vy neni smeroplatne, spousta lidi to vnima s tim zasahem do soukromi jinak, jak jste si jiste nejen v teto diskuzi mohl vsimnout. A ten TL;DR zbytek je jen fnukani ;-) Ostatne vsimli jsme si uz jinde, ze mate nutkavou potrebu RH lezt do zadku a krecovite obhajovat to, kam se to nepekne plizive meni od dob, kdy to pohltil tam Institute of Black Magic. A jak tu padlo i v jinych komentarich, treba Valve to take dela jinak a funguje jim to. Muzete to zpochybnovat, ale to jea si tak vse... :-)
Jak to vnimate vy neni smeroplatne, spousta lidi to vnima s tim zasahem do soukromi jinak, jak jste si jiste nejen v teto diskuzi mohl vsimnout. Ostatne vsimli jsme si uz jinde, ze mate nutkavou potrebu RH za všechno nesmyslně kritizovat.
A jak tu padlo i v jinych komentarich, treba Valve to take dela jinak a funguje jim to.
Ne, to tu nepadlo. To, co tu padlo, by se dalo interpretovat, že Valve to dělá jinak – ale to, že jim to funguje, jste si přibásnil sám. Navíc tam byla reakce, že to, co může fungovat pro Valve nemusí fungovat pro Fedoru.
Nemůžu se zbavit dojmu, že už jste definitivně přešel jenom na trollení.
Tak toho nazoru, ze v RH pod vlivem institutu cerne magie nekomu asi preskocilo jsou uz i u Oracle ;-)
Analphabet Incorporated tie dáta má celkom určite presné.
Je len otázkou času, kedy pribudne GD ich clown computing do dlhého zoznamu na https://killedbygoogle.com
Hezký den a týden!
Teoreticky by to mohlo fungovat. Otázka je, jestli by to dávalo statisticky relevantní data i na úrovni počtu uživatelů, jaký má Fedora Workstation (ostatních variant se ta telemetrie netýká). Steam má 130 milionů MAU, Fedora Workstation není reálně ani na setině. Buď bychom měli mnohem menší vzorek nebo bychom s tím museli otravovat mnohem větší procento uživatelů.
Logiku věci chápu a nijak zvlášť metriky nerozporuju. Ale tady si tak trochu odporujete. Říkáte ze vám například jde o to zjistit kolik lidi konkrétní věc používá. Říkáte když uděláte dotazník a primárně se vám tam nahrnou lidi co to používají, tedy budete mít celkem zajímavý vzorek lidi co to používají včetně odhadu jejich počtu ;-)
Dotazník je super, když chcete od uživatelů získat podrobnější feedback: používáte XY? Na jaké problémy narážíte, k jakému účelu to používáte? Apod. Když chcete získat statistické informace, tak je to fakt k ničemu. Odhad počtu z takového dotazníku je hrubý asi takto: pokud na to odpoví málo lidí, tak to skoro nikdo nepoužívá, pokud na to odpoví víc lidí, tak to asi používá víc lidí než skoro nikdo.
Tak zde spíše záleží jak formulujete ten dotazník. Btw většina průzkumu veřejného mínění funguje právě na bázi dotazníku ;-) a proto tvorba dotazníku je celkem věda pro statistiky nikoliv developery. Odhad z opt-in/out bude přibližně stejné kvality, protože je to stejný princip, jen ten dotaznik vyplní stroj, teda pokud si nepovedete statistiku o tom kolik lidi se nechce zúčastnit statistiky, ale pak tak trochu negujeme ten opt-in/out princip
Vždycky to je o tom, jestli se vám podaří udělat reprezentativní vzorek. Problém je ta mlčící většina, která se vám nikdy do takového online dotazníku nezapojí. Pořád jsou to ale uživatelé a nás zajímají. Moje máti používá Fedoru, ale nikdy by ji nenapadlo v takové dotazníku odpovídat.
Dělat dotazník, kterého se zúčastní jen aktivní uživatelé, které to zajímá, je jako dělat průzkum preferencí politických stran na fakultě politologie. Dá vám to podstatně jiné výsledky, než jaké v populaci reálně jsou. Proto agentury posílají lidi do terénu, regionů a celkově investují nemalé peníze, aby udělaly reprezentativní vzorek. Jak to ale udělat u softwarového produktu, který používají lidi po celém světě? Dotazník ve stylu Steamu by teoreticky mohl fungovat, otázka je, jak by to fungovalo při počtu uživatelů Fedory. Problém je i UX, náhodně vyskakující okno s žádostí o odeslání informací o systému taky není žádná hitparáda. Vím, jak mě to samotného štve, když to dělá Gemius v prohlížeči. A snad nikdy jsem se jim do toho nezapojil.
Těžko říct, jestli opt-in/opt-out telemetrie dodá podstatně lepší výsledky. Já osobně si myslím, že se to nakonec schválí v takové podobě, že to moc užitečné nebude. Opt-out má nicméně výrazně větší šanci zachytit tu mlčící většinu.
V gvfs je hromada dalších backendů, které zobrazují jako storage něco, co není file system, např. WebDAV. Ono to má oproti klasickému syncu své výhody i nevýhody. Nicméně knihovna libgdata, na kter to závisí, je v upstreamu neudržovaná a je otázka, jestli to stojí za to, abychom my čas našich vývojářů investovali do libgdata kvůli této funkci. Nechci tady zabíhat do detailů. Uváděl jsem to jen jako příklad, kde se tato statistická data hodí. Řešíme takové věci dnes a denně.
Pokud to bude dobrovolne, default vypnute, nebo se to bude ptat pri instalaci, tak proc ne - v Linuxu nejde moc dobre utajit nejaka svinarna, kdyz to bude vcetne source kodu a pokud nedaji rootkit do jadra, na skryvani procesu a konexi, tak se zjisti uplne vse.
Ja obcen moc data neposkytuji, presneji USA mi je krade a ja o tom vim, mam problem ze USA a EU a CR ma moje data, kdyz koliv si nekde na US sitich uprdnu, zatoto Cinske cloudy, to je jina, tam vas lseduji transparentne, netaji se tim a hlavni bonud, kdyz je vlada CR pozada o data, tak jim ani nereknou ze si maji trhnout, Cina je znama tim, ze proste mlci a ignoruje to.
Nic jako anonymni telemetrie neexistuje. Protoze minimum, co jim muze byt k necemu uzitecne je HW na kterem to bezi, verze firmware v tom HW a seznam balicku. Vsechno jsou to informace uzitecne k moznemu hledani spolecne priciny nejakeho problemu. A uz tohle staci k vytvoreni unikatniho fingerprintu zarizeni (realne toho budou sbirat vic).
A spojit fingerprint zarizeni s konkretni osobou neni pro firmy, ktere se zivi prodejem zakazniku (*) s konkretni osobou je celkem snadne.
(*) oficilene reklamy zakaznikum, ale vime co je zbozi, ktere je predmetem obchodu. Ne, nemyslim ze by prodavali neci identitu. Ve vlastnim zajmu potrebuji fungovat jako meziclanek mezi zakaznikem (inzerentem) a zbozim (lovenym zakaznikem)