No, popravdě zrovna informace o nainstalovaných balících mi přijde výrazně citlivější než informace o hardware. Jaký mám procesor, množství RAM, rozlišení monitoru... to bych snad neměl problém poskytnout i neanonymně. U seznamu nainstalovaných balíčků by se cukal podstatně víc, protože to by o mně také mnohem víc prozradilo.
Zrcadla nemusí být zas až takový problém, protože jejich seznam a kdo se kam bude připojovat je asi v distribuci přednastavené, nebo to distribuce může ovlivnit. Takže třeba pro Českou Republiku by stačilo data ukládat na hlavním repozitáři a českém zrcadlu a budete mít celkem dobrý přehled kdo co má nainstalované v jedné zemi. Klidně můžete udělat nějaké pořadí mirroru a preferovat ty co ty data sbírají a až za ně dát ty univerzitní co ty data nesbírají.
Rek bych ze pouzvani soukromou osobou bude asi tak pravdepodobny, jako ze na ulici potkas duhovou vranu.
Jednak tux v domacnosti = tux v domacnostni ITka. Druhak se nadoma typicky mnohem castejs a pravdepodobnejs pouziva nejaky to buntu. Naopak, Fedoru bys velice pravdepodobne nasel v korporatnim prostredi.
Ono je taky rozdil mezi tim, zda-li je to opt-in (pojeti Debianu) a nebo opt-out (tak jak to zvazuje Fedora). Dokonce si v tom textu pani z RedHatu zduvodnuje, proc to ma byt opt-out a ne opt-in (ten ma zustat jen u upgrade, ze pry opt-in jsou zparchantele metriky) - a i tam to bude zparchantele tim zpusobem, ze lokalne se ty metriky zbirat budou (aneb dalsi bloatware)... cimz se to od toho Debianu lisi (tam se popcon proste nenainstaluje a ty data se nesbiraji ani lokalne, RedHat si v tomto zda se ponechava jisty backdoor). A vubec to tak nejak RedHat zda se resi systemem ala Windowze... ;-)
Opt-in vždycky znamená malý a zpravidla nereprezentativní vzorek. Když potřebujete vědět, kolik z uživatelů používá XY, jestli se tomu věnovat nebo ne, tak je k ničemu, když máte data ze vzorku jednotek procent uživatelské základny, který může klidně vykazovat chybovost (rozdílnost oproti skutečnosti) v řádu desítek procent.
Když se to v týmu řešilo, tak já jsem byl toho názoru, aby se žádná telemetrie nezaváděla. Cokoliv opt-out, je prostě rudý hadr, ať je to anonymizované a agregované, jak chce. Cokoliv opt-in, je zpravidla k ničemu.
Ano, rudý hadr to vystihuje dobře. Ještě je (byť taky otravná) možnost prudit uživatele při interakci s oním softwarem nějakým dialogem, dokud si nevybere, jestli se chce nebo nechce zúčastnit, podobně jako se slavnými cookies. Do té doby jednoznačně nic nesbírat a neposílat. Odhaduji, že by se tam dalo nasbírat (těžko říct o kolik) víc dat než při opt-in a i když by to lidi štvalo, necítili by zradu v tom, že se data implicitně sbírají bez jejich souhlasu.
Ono to není tak, že by to bylo po instalaci systému aktivované a uživatel na to nebyl upozorněný. By default to je vypnuté. Při prvním spuštění systému se spouští tzv. initial setup, což je série obrazovek, které uživatele provází úvodním nastavením systému, a na obrazovce s nastavením soukromí, kde už teď máme třeba souhlas se zasíláním informací o pádech, má být, jestli chce odesílat telemetrii. Opt-out vs opt-in v tomto případě je, že je ta volba by default zatrhlá a uživatel ji na té obrazovce musí vypnout místo, aby byla vypnutá a on ji musel zapnout. Bez schválení této obrazovky uživatelem se ale telemetrie nezapne. Aktivuje se to až v momentě, kdy tu volbu nechá zapnutou a dokončí initial setup. Proto se to třeba netýká již nainstalovaných systémů. U nich bude muset uživatel jít a explicitně to povolit v nastavení.
Ted jsem to chtěl napsat. To je totiž zásadní rozdíl mezi CCPA (který je opt-out) a GDPR (která je opt-in) Co je zajímavé a nutné říct, ze to eos-metrics provádějí IP geolokaci, také dělají statistiku jak dlouho user strávil v jakem programu, kdy šel system poprvé on-line, při každém dalším bootu posila geolokovany ping event. Jo a nemusím říkat že to je pomocí lib embedded přímo v GNOME Shell, jaká je konkrétní implementace ve Fedora netuším, jak moc kopírují implementaci EndlessOS.
Je to škoda. Fedora bola fajn distribúcia.
Ale niečo sa zlomilo.
Najprv: https://bugzilla.redhat.com/show_bug.cgi?id=1435968
Potom: https://bugzilla.redhat.com/show_bug.cgi?id=1979565
Au revoir!
Softwarové patenty se ve Fedoře řešily odjakživa. Vždyť tam nebývala ani podpora pro MP3 a prakticky žádné video kodeky. Proto taky existuje rpmfusion.
Blbé je, když to nějaký software neumožňuje obejít (konflikty souborů) a když si nějaký upstream přímo tu kontrolu vynutí v README no..
Já bych mohl přidat třeba https://bugzilla.redhat.com/show_bug.cgi?id=853998, který mě štve už deset let (to k tomu "byla fajn"). Jenže Ubuntu nechci a Fedora dělá spoustu věcí tak jak potřebuju.
Někteří maintaineři jsou prostě tvrdohlavější než jiní... a Jirka Eischman promine, zrovna desktop obecně a vývojáři z Gnome speciálně byli tvrdohlaví odjakživa co pamatuju :)
Ano, tahle argumentace kolem opt-in je videt uz z "originalu"... :-) Jako je jasny, co je "motivaci" - na zaklade podobnych dat rict, ze XYZ pouziva minimum lidi a pohrbit to.... jenze kde je problem? :-) Hromada veci se historicky zbesile patchovala a je to logicky z pohledu spravce distribuce dost tezko udrzovatelne. Mate na vyber ze dvou moznosti - snazit se minimalizovat ty "lokalni" patche a nebo danou vec proste "pohrbit". Ten problem s komplikovanou udrzbou mnohych baliku si distribuce dost casto... tak nejak vyrabi samy, ze? A jasne, mnohe veci jsou dedictvi minulosti.
A neteoretizuju, par distribucnich baliku jsem parkrat takto vzal - stylem, ze jsem proste jen potreboval build novejsi upstream verze. A prave na tech patchich si jde dost casto vylamat zuby.
Ja teda tu cestu nevidim v tom, ze se vyhazi "ne az tak oblibene baliky", ale prave v tom, ze se eliminuji ty home-made patche na mininum...
Tady nejde o to, co zahrnout do distribuce, ale o upstreamový vývoj. Třeba teď řešíme, jestli dál v gvfs podporovat Google Drive. Vyžadovalo by to nemalou investici do knihovny libgdata. Vůbec nevíme, kolik uživatelů to reálně používá a jestli má smysl to dál dělat nebo omezený čas věnovat raději něčemu jinému. S odpověďmi na tento typ otázek to má pomáhat.
Když bychom udělali dotazník, tak se tam nahrnou primárně lidi, kteří danou věc používají, a výsledky to zásadně zkreslí.
A ted si predstavte, ze byste chtel vyvijet neco zcela noveho... kde asi tak posbirate stejna data? ;-) To dopredu taky nezjistite, kolik lidi to doopravdy vyuzije. A i kdybyste udelali nejaky predbezny pruzkum formou nejake ankety, tak vam to nezaruci, ze lidi fakt vysledny produkt pouzijou. A ani pruzkum nad existujici knihovnou ne - muze se klidne stat, ze to tim vyvojem zmrsite tak, ze lidi se poohlednou po alternative (treba nejakem forku).
Snazite se ten vymysl z korporatu (kde nekdo muze vykazovat cinnost a moc se u toho nenadrit) obhajit hezky, ale ona by ta anketa pri aplikaci vhodnych statistickych metod udelala podobnou funkci. I s tou vasi telemetrii (taky vyvoj - bloatware, na to cas je?) zadnou zaruku lepsich dat nemate - zrovna Linux IMHO zvlaste na desktopech pouzivaj lidi, co ochranu soukromi resi vic... tedy ten magicky nove vyvinuty software na sber dat budou ve velkem vypinat...
Danny: Víte o tom, že vaše argumenty vůbec nejsou proti telemetrii? To, že průzkum před novým produktem se musí dělat jinak (dráž, méně spolehlivě) vůbec neznamená, že pro stávající produkty se to nemůže udělat levněji přesněji (telemetrií). Navíc vytvoření nového produktu je něco jiného, než zrušení současného – když nevytvoříte nový produkt, nikoho tím nenaštvete. Když zrušíte existující produkt, naštvete tím jeho uživatele a několik komentujících, kteří jej nikdy neviděli. Proto je docela důležité vědět, kolik těch uživatelů je.
zrovna Linux IMHO zvlaste na desktopech pouzivaj lidi, co ochranu soukromi resi vic... tedy ten magicky nove vyvinuty software na sber dat budou ve velkem vypinat...
Lidé, kteří doopravdy řeší ochranu soukromí, nejspíš nebudou mít důvod ten software vypínat. Vypínat to budou lidé, kteří dělají hlouposti a svádějí to na ochranu soukromí. A i kdyby to vypnulo 50 % uživatelů, pořád to bude dávat relevantní data.
ona by ta anketa pri aplikaci vhodnych statistickych metod udelala podobnou funkci
Tak nám ty vhodné statistické metody ukažte. Jak zajistíte, aby v té anketě rovnoměrně hlasovali ti, kteří produkt používají i kteří ho nepoužívají a neuděláte z jedné anketní otázky pětistránkový dotazník.
Lidé, kteří doopravdy řeší ochranu soukromí, nejspíš nebudou mít důvod ten software vypínat. Vypínat to budou lidé, kteří dělají hlouposti a svádějí to na ochranu soukromí. A i kdyby to vypnulo 50 % uživatelů, pořád to bude dávat relevantní data.
Můžete tohle tvrzení nějak dokázat? Z mého pozorování takovéhle věci naopak většina lidí v mém IT okolí skutečně vypíná. Já bych si klidně tipnul, že to vypne i 90% lidí. Navíc pokud budete chtít statistiku u nějakého pokročilého softwaru a většina jeho uživatelů bude mít telemetrii vypnutou tj. zrovna budou v těch "vašich" 50%, tak zjistíte akorát, že lidé co mají zapnutou telemetrii ten software nepoužívají, nic víc nic míň.
10. 7. 2023, 08:52 editováno autorem komentáře
Z mého pozorování takovéhle věci naopak většina lidí v mém IT okolí skutečně vypíná.
To ale neznamená, že tím opravdu řeší ochranu soukromí. Otázka je, jak relevantní vzorek je vaše sociální bublina.
I kdyby telemetrie nefungovala pro nějaký pokročilý software, pokud bude fungovat alespoň pro nějaké rozumné množství softwaru, dává to smysl. Není potřeba, aby ta telemetrie byla úplně dokonalá.
To ale neznamená, že tím opravdu řeší ochranu soukromí.
Myslím, že tohle je strašně subjektivní. Někomu nevadí, že má někde fotku, adresu rodné číslo a někomu vadí, když někdo ukládá data o jeho počítači (je mi jasné, že opět napíšete, že používá software Fedory a tedy jsou to Fedory pravidla, tak si to můžete rovnou odpustit, to je asi všem jasné). Rozhodně bych se nebál říct, že vy rozhodně nejste nějaký soudce z lidu, který říká co je soukromí člověka a co není, to může říct člověk jenom sám, kde tu hranici má.
Otázka je, jak relevantní vzorek je vaše sociální bublina.
Tomuhle já už říkám klasická Jirsákovina. Napsal jsem snad to snad jasně, že to je pouze mé okolí a pouze mé pozorování a pouze můj tip. Nic víc nic míň. Naproti vašemu, celkem sprostému, onálepkování lidí, kteří by něco takového vypnuli:
Vypínat to budou lidé, kteří dělají hlouposti a svádějí to na ochranu soukromí.
někomu vadí, když někdo ukládá data o jeho počítači
Jenže Fedora neví, komu ten počítač patří.
Rozhodně bych se nebál říct, že vy rozhodně nejste nějaký soudce z lidu, který říká co je soukromí člověka a co není, to může říct člověk jenom sám, kde tu hranici má.
V tom máte pravdu. Nicméně když ty údaje nedokážete přiřadit konkrétnímu člověku, není to soukromí člověka a nemůže si to říct ten člověk sám, protože nevíme, kdo to je.
Napsal jsem snad to snad jasně, že to je pouze mé okolí a pouze mé pozorování a pouze můj tip.
Tohle jste napsal jasně, ale pak jste z toho dělal dost odvážné závěry.
Naproti vašemu, celkem sprostému, onálepkování lidí, kteří by něco takového vypnuli
Kdybyste to nevytrhával z kontextu, nebude vám to připadat sprosté.
Mozna byste se mel namisto vaseho zvatlani zacist do reakci u zdroje a realizovat se se svymi moudry primo tam :-) Fedora ma povest distribuce, kde se na ochranu soukromi hodne dbalo, bylo to podavane jako soucast znacky.
Podle Vasi teorie by zjevne nemohl fungovat zadny pruzkum... :D No asi byste mel prestat fusovat do prace statistikum, kdyz jejich praci nerozumite... ;-) A nebo se jit aspon s nima poradit, nez zas placnete nejaky nesmysl do diskuze.
Fedora ma povest distribuce, kde se na ochranu soukromi hodne dbalo
Na té navržené telemetrii nevidím nic, co by do soukromí zasahovalo.
Podle Vasi teorie by zjevne nemohl fungovat zadny pruzkum...
Ale mohl. Jenže průzkum, který má sadu otázek, jeho vyplnění nějakou dobu trvá, účastníci se vybírají podle sociodemografických údajů a za čas strávený průzkumem získávají odměnu, je něco jiného, než jednoduchá anketa. Zejména cenově.
No asi byste mel prestat fusovat do prace statistikum, kdyz jejich praci nerozumite... ;-)
No evidentně jejich práci rozumím lépe, než vy, když vy byste si do ankety nějaké výsledky přičaroval. To, co popisoval Jiří Eischmann, totiž znamená, že už výběr respondentů ovlivňuje výsledek ankety – a to žádnou „statistickou metodou“ nezvrátíte. Ovlivnit byste to mohl jedině tak, že do té ankety vtáhnete lidi tak, že nebudou předem vědět, na co budou odpovídat. Taková anketa je podstatně náročnější a hlavně ji vyplní podstatně méně lidí.
Jak to vnimate vy neni smeroplatne, spousta lidi to vnima s tim zasahem do soukromi jinak, jak jste si jiste nejen v teto diskuzi mohl vsimnout. A ten TL;DR zbytek je jen fnukani ;-) Ostatne vsimli jsme si uz jinde, ze mate nutkavou potrebu RH lezt do zadku a krecovite obhajovat to, kam se to nepekne plizive meni od dob, kdy to pohltil tam Institute of Black Magic. A jak tu padlo i v jinych komentarich, treba Valve to take dela jinak a funguje jim to. Muzete to zpochybnovat, ale to jea si tak vse... :-)
Jak to vnimate vy neni smeroplatne, spousta lidi to vnima s tim zasahem do soukromi jinak, jak jste si jiste nejen v teto diskuzi mohl vsimnout. Ostatne vsimli jsme si uz jinde, ze mate nutkavou potrebu RH za všechno nesmyslně kritizovat.
A jak tu padlo i v jinych komentarich, treba Valve to take dela jinak a funguje jim to.
Ne, to tu nepadlo. To, co tu padlo, by se dalo interpretovat, že Valve to dělá jinak – ale to, že jim to funguje, jste si přibásnil sám. Navíc tam byla reakce, že to, co může fungovat pro Valve nemusí fungovat pro Fedoru.
Nemůžu se zbavit dojmu, že už jste definitivně přešel jenom na trollení.
Tak toho nazoru, ze v RH pod vlivem institutu cerne magie nekomu asi preskocilo jsou uz i u Oracle ;-)
Analphabet Incorporated tie dáta má celkom určite presné.
Je len otázkou času, kedy pribudne GD ich clown computing do dlhého zoznamu na https://killedbygoogle.com
Hezký den a týden!
Teoreticky by to mohlo fungovat. Otázka je, jestli by to dávalo statisticky relevantní data i na úrovni počtu uživatelů, jaký má Fedora Workstation (ostatních variant se ta telemetrie netýká). Steam má 130 milionů MAU, Fedora Workstation není reálně ani na setině. Buď bychom měli mnohem menší vzorek nebo bychom s tím museli otravovat mnohem větší procento uživatelů.
Logiku věci chápu a nijak zvlášť metriky nerozporuju. Ale tady si tak trochu odporujete. Říkáte ze vám například jde o to zjistit kolik lidi konkrétní věc používá. Říkáte když uděláte dotazník a primárně se vám tam nahrnou lidi co to používají, tedy budete mít celkem zajímavý vzorek lidi co to používají včetně odhadu jejich počtu ;-)
Dotazník je super, když chcete od uživatelů získat podrobnější feedback: používáte XY? Na jaké problémy narážíte, k jakému účelu to používáte? Apod. Když chcete získat statistické informace, tak je to fakt k ničemu. Odhad počtu z takového dotazníku je hrubý asi takto: pokud na to odpoví málo lidí, tak to skoro nikdo nepoužívá, pokud na to odpoví víc lidí, tak to asi používá víc lidí než skoro nikdo.
Tak zde spíše záleží jak formulujete ten dotazník. Btw většina průzkumu veřejného mínění funguje právě na bázi dotazníku ;-) a proto tvorba dotazníku je celkem věda pro statistiky nikoliv developery. Odhad z opt-in/out bude přibližně stejné kvality, protože je to stejný princip, jen ten dotaznik vyplní stroj, teda pokud si nepovedete statistiku o tom kolik lidi se nechce zúčastnit statistiky, ale pak tak trochu negujeme ten opt-in/out princip
Vždycky to je o tom, jestli se vám podaří udělat reprezentativní vzorek. Problém je ta mlčící většina, která se vám nikdy do takového online dotazníku nezapojí. Pořád jsou to ale uživatelé a nás zajímají. Moje máti používá Fedoru, ale nikdy by ji nenapadlo v takové dotazníku odpovídat.
Dělat dotazník, kterého se zúčastní jen aktivní uživatelé, které to zajímá, je jako dělat průzkum preferencí politických stran na fakultě politologie. Dá vám to podstatně jiné výsledky, než jaké v populaci reálně jsou. Proto agentury posílají lidi do terénu, regionů a celkově investují nemalé peníze, aby udělaly reprezentativní vzorek. Jak to ale udělat u softwarového produktu, který používají lidi po celém světě? Dotazník ve stylu Steamu by teoreticky mohl fungovat, otázka je, jak by to fungovalo při počtu uživatelů Fedory. Problém je i UX, náhodně vyskakující okno s žádostí o odeslání informací o systému taky není žádná hitparáda. Vím, jak mě to samotného štve, když to dělá Gemius v prohlížeči. A snad nikdy jsem se jim do toho nezapojil.
Těžko říct, jestli opt-in/opt-out telemetrie dodá podstatně lepší výsledky. Já osobně si myslím, že se to nakonec schválí v takové podobě, že to moc užitečné nebude. Opt-out má nicméně výrazně větší šanci zachytit tu mlčící většinu.
V gvfs je hromada dalších backendů, které zobrazují jako storage něco, co není file system, např. WebDAV. Ono to má oproti klasickému syncu své výhody i nevýhody. Nicméně knihovna libgdata, na kter to závisí, je v upstreamu neudržovaná a je otázka, jestli to stojí za to, abychom my čas našich vývojářů investovali do libgdata kvůli této funkci. Nechci tady zabíhat do detailů. Uváděl jsem to jen jako příklad, kde se tato statistická data hodí. Řešíme takové věci dnes a denně.