Je to dokumentované chování. Zed skenuje všechno co je vidět pod "workspace" stromem, zase ve jménu UX (globální fuzzy search čehokoliv). Nejen že si projde filesystem, ale i na něj drží inotify watches, takže je informován o změnách.
Když např. otevřete ~/something.py, Zed si naskenuje celý ~/ pro případ, že bude uživatel něco chtít. Když tam někde vede symlink vejš (typicky ~/.wine/dosdevices/z: -> /), tak se holt dostane i do rootu, a prošmejdí úplně všechno.
Mě se po otevření souboru začal systém vyptávat, jestli aplikaci povolím přístup k ... no ke všem typům dat a částí FS včetně síťových disků atd. Než jsem pochopil, že bude zkoušet úplně všechno, tak jsem mu povolil přístup k Ploše a Stahování a pak mi došlo, že půjde úplně po všem, včetně kontaktů apod. takže pak dostal na všechno ban. Pak jsem jako první chtěl vidět celý obsah otevřeného souboru a pokoušel jsem se zapnout zalamování řádků - pochopitelně nikde v menu jsem nic nenašel. Hledal jsem v dokumentaci a zjistil jsem, že jde o klasický paskvil, kde si (a to jen "teoreticky") můžu vyeditovat konfigurační JSON. Kde to jsme? Tyhle prasárny by na Mac OS vůbec neměly být povoleny. Pak se ukázalo, že defaultní konfigurace stejně nejde editovat. Takže šel do věčných lovišť. Jen jsem se na..štval, že ztrácím čas.
Tak jako celý disk prochází i starý locate. Co je důležité je spíš to, vědět a mít kontrolu nad tím, co se se získanými metainformacemi děje, jestli zůstávají v zařízení nebo kam jsou posílané a jak je pak s nima nakládáno a k čemu slouží.
To znamená jak budou zpracované, jestli budou zdrojem jen pro lokální dotazy uživatele zařízení nebo se využijou v cloudu pro dotazy ostatních uživatelů (tj.trénování aplikace nebo modelu), v jaké míře a z kterých souborů nebo typů souborů atd..
V každé této fázi bych chtěl určitě mít možnost to předem odsouhlasit, anebo naopak zrušit souhlas přes nějaký checkbox s tím, že v případě zrušení souhlasu by se získané informace (tedy mimo ty, které jsou z principu zpracování zcela anonymní) odstranily. A taktéž mít související, aktualizovaný přehled, jaký objem informací každého druhu byl zpracovaný a k čemu.
Pokud toto tvůrce aplikace není schopen doložit, tak určitě nepoužívat, protože je to pak v podstatě jakýsi trojan, který má možnost třeba krást intelektuální vlastnictví... byla by to vlastně postaru řečeno taková průmyslová špionáž. Dovedu si navíc i představit, že mohou existovat ekluzivní smlouvy pro organizace, které si to zaplatí, aby měly k datům na serveru exkluzívní přístup a mohly využívat data pak jinak než k AI účelům přes aplikaci tj.těžily je přímo přes své AI z databází.