Ako čo tí ľudia čakali že sa stane? A nechápem že riaditeľa pre bezpečnosť "AI" vo firme ako Meta netuší ako funguje "AI" a úplne najzákladnejšie princípy, a že "plne autonómne" fungovanie akejkoľvek dnešnej "AI" je totálny nezmysel.
Tak reditelka ocividne chape jak funguje, protoze hned napsala cim to bylo zpusobene, akorat nedomyslela co se stane pri prechodu z testovaciho inboxu na velky. Normalni lidska chyba.
A ocividne to neni totalni nesmysl, kdyz pise ze ji to dobre fungovalo na testovacim inboxu.
To ze to je nesmysl z bezpecnostniho hlediska je druha vec. Ale pamatuju jak se kdysi rikalo ze davat vsechny soukrome emaily googlu (GMail) je totalni bezpecnostni nesmysl, a dneska tam maji emaily i lide co by se v tom meli vyznat a umet posoudit rizika.
Chce to vice kritickeho mysleni a mene automatickeho nadavani.
Já bych oponoval - nechápala to - pochopila to až když se něco nepříjemného stalo. Toto jsou přesně lidi, co budou někomu říkat jak je něco super bezpečné, a pak to vyjde z labu do reálného provozu a udělá to přesně takový kopanec.
Co presne chapala se asi od stolu nedovime, ale vzdelani, zkusenosti i to jak popsala incident me spis naznacuji ze tomu rozumi nez opak.
Ja bych si teda, narozdil od tebe, nedovolil o nekom tvrdit ze "Toto jsou přesně lidi...", kdyz je vubec neznam.
Kdyby tomu co dela rozumela, tak by tomu nikdy nedala pristup k ostrym datum. To je totiz jen potvrzeni toho, ze vubec netusi co dela, coz ostatne plati pro vsechny managory.
Dost pochybuju i o tom, ze popis toho co se stalo pochazi od ni.
Zpochybnit muzes vsechno. Muzes zpochybnit co reditelka vi, muzes zpochybnit cemu rozumi, muzes zpochybnit cokoliv, ale jedine co ovlivnis bude moje mineni o tvych predsudcich.
Možná za tím může být i trochu jiný příběh. Vzhledem k její pozici bych čekal že podobné vystupování prochází alespoň nějakým PR filtrem. U firmy jako Meta si fakt neumím představit že by senior executive veřejně komunikoval způsobem který z ní udělá magora co tomu nerozumí. Klidně je totiž možné, že tušila co to udělá (protože u AI se těžko vzhledem k nedetermističnosti "ví") -- a chtěla tím upozornit na reálná rizika AI (přeci jenom zní jinak openclaw mi smazal testovací data vs. openclaw mi smazal všechny maily).
Zároveň tím vznikla poměrně virální zmínka o Metě.
Ve finále, všeobecně předpokládám že Meta má zalohy všeho, takže se v reálu stalo jedno velké nic :-)
Obnova zaloh = cas = penize.
Schvalne, pocitam ze mas v okoli widlouzivatele ... takze kolik z nich zvladne na folderu nebo souboru kliknout pravym ... (to je prvni krok, kterej odstreli tak 80%) ... a kolik z nich, zvladne vybrat "vlastnosti" (prave sme to zredukovali tak na 1%) ... a kolik z nich vubec tusi, ze je tam tab "predchozi verze" ... coz je neco, co bude fungovat v kazdy firme ktera ma svepravny IT.
Neznam zadny normalni mailovaci prostredi ktery by na mazani mailu reagovalo tim, ze ho smaze. Vzdycky skonci v kosi. A ano, ten kos muzes vyklopit, ale ani to typicky zadny maily nemaze ... jenze neznam osobne ani jedinyho uzivatele, kterej by to vedel a umel s tim pracovat.
Takze musis zaplatit ITka aby to resil.
Vazne bych pak chtel videt i tupyho managora, kterej si u tebe cokoli koupi, kdyz se budes verejne chlubit tim, ze mu to pak ty data proste smazne.
Apropos kdyz sme u zaloh ... prave mi dorazila nabidka cmoudu ... 5TB (ciste uloziste) ... se 100Mbit linkou (lol) ... za ... 5kKc ... mesicne. Tak sem tak koukal ze za ten rok v cmoudu si poridim vlastni HW s tak cca 50TB prostoru ... a za dalsi rok si ho na 10 let soupnu nekde do racku (s Gbitem).
Jako bonus to ma jednu zasadni vlastnost, ze to muzu capnout a prenyst fyzicky kamkoli a tudiz kdyby bylo treba, muzu to pripojit jak by bylo treba.
Musí to sama používat. Tedy měla by. Pracuje v týmu, který se snaží dostat AI k maximu lidí. Měla by to tedy používat i ona. Prostě ukázat, že tomu sama věří natolik, že to používá. Opak by byl pokrytectví.
Zhruba jako dávná scénka z hospody s Felixem Holzmanem, "kuchař tu teď není, šel naproti do hospody na oběd."
Možná by jí při téhle příležitosti mohlo dojít, že idea dostat to mezi maximum lidí má drobné mouchy.
Takže nám tady vzniká, jak v takových situacích bývá obvyklé, díra na trhu.
Teď je šance prodávat AI guardy, kteří budou chránit před horlivými AI asistenty.
Samozřejmě ti guardi budou potřebovat "minimálně" rootovský přístup, aby měli navrch.
Konečně začíná být na tom zatuchlém kyberbezpečnostním rybníčku zasejc veselo.
Už jsme se nudili.
A dobře ji tak.
- pracuje pro jednoho z pachatelů tohohle bordelu
- pokud by na svém místě měla co dělat, tohle měla vědět předem
Btw pravidelně se mi na počítači spouští https://www.offlineimap.org/
Ale je dost pravděpodobné, že pro pracovní maily to narazí, ale alespoň u soukromého je to dobré pro klidný spánek.
Základ bezpečnosti, dávno před AI, je nevěřit článkům o katastrofách světa, zejména jak ještěři a SW přebírají vládu.
Jak je pravděpodobné, že je to pravda ve smyslu "nebezpečí" a replikace té situace. To je jako příběh, jak někdo jel a 100km mu praskla pneumatika. To samo o sobě nic neříká, jde o okolnosti. Už XX let platí situace, že významné % ztráty dat, třeba archivu fotek, mailů je při činnosti typu "promazání" a "konsolidace" archivu. To je příhoda úplně k ničemu. Já jsem takto jako ona přišel o data (jestli o ně přišla) 2x, naštěstí omezeně, poprvé někdy 1999 a podruhé 2005, pustil jsem skript, který mi rozházel foldery podle nějaké logiky a nakonec jsem měl archivované náhledy 600*480 a originály fotek jsem si smazal. Pustit jakoukoli rutinu "vyzkouším co to udělá" na 120G dat v mailové schránce je smrtící v roce 2000 i 2026. Jestli to někdo vyhodnocuje jako riziko, tak je riziková spíš ta naivita.
Základní pravidlo třeba knihovníků a archivářů už nejméně tak sto let: nikdy, nikdy, pokud možno fakt nikdy nepřevádějte katalogové záznamy z jednoho formátu do druhého. Proto se dnes taky stále běžně používá k popisu knihovních záznamů MARC 21 což je formát vyvinutý někdy v polovině šedesátých let založený na Z39.2; v dnešní době opravdu těžký anachronismus.
"AI začala mazat" je asi něco jako "Disk Cleaner který naprogramoval Láďa" smazal 500 důležitých souborů, pracovnice pustila program a když se vrátila z oběda tak XY.... toto jsou clickbaity. V https://openclaw.ai/ něco naprogramovali a posrali to. Tak jako se to mohlo stát u CCcleaneru v roce 1999, zálohovacího SW v roce 2010. Další clickbait je podprahová informace "ani šéfové security labů AI nezvládají". Na těchto pozicích mohou být lidé jako Schillerová, Kalousek, protože mají některé předpoklady tuto funkci vykonávat a matematiku měli naposledy na střední. Za mě je největší alert, z jakého důvodu toto víme. "Screenshoty z jejího chatu" ... ona pracuje na vysoké pozici ve firmě, kde je základ reputace a důvěryhodnost při práci s daty a pak pustí i s dokumentací takovýto incident? Má IQ 89 nebo se to nikdy nestalo?
Rámcově ano, ale dovedu si představit implementaci, že mi to připraví logiku "čištění" a nabídne to k verifikaci. A pak konvenčně napsaná rutina to provede. Tedy pustím LLM na analytiku, nechám vizualizovat co našel a co udělá, když řeknu krleš. Dám krleš a něco napsané v "cobolu" to provede a na konci je velké tlačítko s unrollem po dobu 30 dnů. Pustit Copilota na excelový soubor je loterie a to je jejich core business. A Meta je firma, která si zakládá na tom, že mají vysoké standardy práci s daty. Například ostré data nepoužívají interně na testy, nepoužívají je na prezentace obchodním partnerům a nedej bože si manažer nedovolí vypracovat příběh jak něco posral a i s dokumentací to zveřejní všem. Co se asi děje, když poserou něco závažnějšího? Neudělají z toho blogový zápise, ale pošlou to mailem všem partnerům, aby se mrkli co se stalo? Nechce se mi to kontrolovat, ale skoro bych čekal, že ta ženská má sice tu funkci tak je napsána, ale prakticky je to nějaký politruk a přišla na pozici do rozjetého vlaku a není v žádném produkčním řetězci a proto má čas a energii takto prezentoval nějaký fail.
Třeba toto takto na první dobrou prakticky nemůže fungovat. Nebo jenom v nějakém inkubátoru. Chodím po fimách a lidi se logují na sdílená hesla, posílají zcela zmatené pokyny, nic nesouhlasí, prakticky třetina energie jde na řízení okolností. Že něco AI najde v excelu v příloze a pošle mail... to je teoretické flow. Na stránkách banky je služba, která je z roku 2017 a v roce 2018 ji přestali nabízet. Popsané procesy aby výklad byl jednoznačný nemá prakticky nikdo. Firma má vygenerovat přepravní štítek mail a ten poslat jako PDF někam jinam. Tam jinde má ženská out of office, je nemocná celý měsíc a má v zástup, kam se to má posílat. Prakticky ale pracuje a ten mail zpracuje. Na 99% firemního prostředí to nemůžete pustit. Tady ty věci musí být úzce specializované, jasné API, jasné procesy. Tedy opak "dotahování věcí". https://www.lupa.cz/aktuality/cupr-nabizi-ai-agenty-ze-sveho-noveho-projektu-maji-dotahnout-praci-za-lidi-do-konce/
Bez ohledu na to, že ten agent je zjevně na tyhle úkoly né zcela vhodný
, viděl bych počátek celého problému někde tady: svůj skutečný, výrazně větší inbox
.
Mít mnohamegabyteový binec v Inboxu je IMHO špatně už od začátku. Tam bych se bál pustit i obyčejné složitější filtrovací pravidlo.
Vazne mluvis o prefixu mega? Managori tam maji minimalne desitky GB a porad si chodej stezovat, ze jim je to malo. Silazujou kazdou chujovinu a nejradsi by mailem posilaly aspon 100GB prilohy.
Ale jo, mluvím o mega
. My máme limit 2 GB, a pokud se dostanu byť do čtvrtiny té kapacity, začne se to chovat všelijak.
Máte pravdu, že jsou borci, kteří mají větší mailboxy, ale pokud na tuhle kapacitu dovedou Inbox, tak je skoro jedno, že se jim občas něco ztratí, protože ty zprávy stejně nenajdou.
(I můj prepubertální synek seznal, že složka Doručená pošta by měla být pokud možno vyřízená do prázdna
. Můj šéf naopak udržuje v Inboxu většinu zpráv, dokud se neujistí, že je opravdu může přehodit do složky Archiv - a nalezení nějakého staršího e-mailu mu spolehlivě zablokuje Outlook.)
Tak neni jedno jestli ten email trci v Inboxu nebo v Archivu? Jedna slozka jako druha. Proste to je jen jiny styl prace nez tvuj.
To ze outlookari nejsou schopni najit starsi emaily je neskutecne vtipne. Vidim to nekolikrat mesicne u kolegu a furt nechapu ze to pouzivaji. Full regexp search je neco o cem se jim ani nezda :)
Ono to opravdu je reálně jedno, pokud tam jsou jen dvě složky: Inbox a Archiv. Problém je, že načítání hlaviček těch tisíců zpráv, neřku-li fulltextové prohledání jejich obsahu, je poněkud dost náročné na systémové prostředky. (A ve chvíli, kdy jsou ty složky kdesi v cloudu, ale prohledávají se lokálně, je to ještě lepší!)
Mnohem lepší je použít nějakou přibližnou adresářovou strukturu, a prohledávat v ideálním případě maximálně pár stovek e-mailů.
A - mimo jiné - je důležité nedůležité co nejdříve vyhodit a vysypat koš. ;o)
Svepravnych lidi je omezene, blbcu je zcela neomezene ... jen kdyz namatkou kouknu tak 20G je tak stredni managorska velikost.
Jasne ze kdybych jim z toho 19G smaznul, tak si nejspis vubec nevsimnou. Sak MS to tak dela, ze lidem maze maily ... Ty desiky GB zcela nepostradatelnych dat jsou totiz instantne zcela postradatelny, kdyz ten clovek skonci.
BTW: Muj pracovni mailbox ma aktuelne 100M.
Hlavně demonstrace toho, že agenty nemůžeš používat ve většině případů, které ti A'I' společnosti budou tlačit.
Za tohle konkrétně ale zcela objektivně a věcně skutečně může zlá AI. Tedy natolik, nakolik může nástroj za výsledek práce. Problém ovšem je, že nástroj poměrně špatně předvídatelný a komplexní. Vy hujeři jste ale fakt neskuteční. Byli byste schopní popřít i vlastní babičku :-D
Ten nastroj ale delal presne to, co delat mel.
Ciste statisticky muzu klidne prohlasit, ze vsechny maily starsi 24 hodin jsou knicemu. Jiste ze to neni 100% pravda, ale 99,9999% A tudiz statisticky model zcela spravne vyhodnotil, ze je proste smazne.
Protoze ja nejsem statistickej model ... tak mam treba nastaveno, ze kdyz uzivatel mail smazne, tak mu zustane jeste 14 dnu v kosi ... a dalsich 14 dnu mu sice z kose zmizi, ale porad jeste existuje a dalsi 3 mesice je v archivu.
Jup a uzivatel (tedy ani pseudoAI) stim nemuze nic udelat, takze by stacilo ty maly v tom kosi oznacit a vratit zpet. Pravda je, ze ani tohle 90% uzivatelu (a 100% managoru) nezvladne.
Heled je to zkusena managerka, z velkeho korporatu kde ti ani nepozdravi kdyz jim to neschvali PR oddeleni tak proc ze sebe delala blbku. Vzdyt musela vedet jak to bude vypadat.
Tady nekdo vrti psem.
tzv. kompresi kontextu a během této komprese agent ztratil původní instrukci
Takže agent věděl, že má něco dělat, ale už nevěděl co, super. Čekal bych, že při kompresi kontextu agent zredukuje jenom ty pracovní data a na původní zadání uživatele hrabat nebude, nebo až po odsouhlasení.
Tak jiste, ze jde pravdepodobne o softwarovou chybu toho agenta, nez chybu AI samotne. Ale to nezni tak dobre a nenapsalo by se o tom tolik komentaru.
Tak nejsem z oboru, přesto o omezeném kontext window vím moc dobře, a i tak si maně vzpomínám, že zcela obecném problému všech LLM modelů ohledně "přizapomínání" u příliš dlouhého kontextu se psalo někdy na podzim.
Tohle není SW chyba, tohle je fundamentální problém.
To že z kontextového okna vypadlo zadání je spíš chyba než fundamentální problém. Tahle část kontextu by měla být nedotknutelná a pokud si jí chce AI přechroupat, tak jedině na základě souhlasu uživatele a kontrole, že to zadání pořád odpovídá. Zejména v případě agentů, kteří něco aktivně dělají.
No fundamentální chyba je AFAIK v tom, že tyhle typy AIček nerozlišují mezi zadáním a daty.
A pak z toho lezou zranitelnosti typu, že si nechám sesumarizovat nějakou stránku a AIčko tam najde injectnutý příkaz, který ochotně vykoná.
Nedotknutelný je akorát nějaký separátní texťák s pár ultimátními příkazy.
jojo, kde jsou ty časy, kdy pořádný poctivý Icewarp klient SW zdvoj-trojnásobil inbox že vše zduplikoval... a za půl roku znovu..
to byly dobré zlaté časy, kdy to ta zlá AI nedělala...
:-)
Ale urcite uz tehda jsme mohli cist hromady odsuzujicich komentaru o onech programatorech, od pisalku komentaru kteri vi vsechno nejlip a jak to ma byt spravne.
Komentare jako tady v diskuzi, napriklad: "netuší ako funguje", "Toto jsou přesně lidi, co budou někomu říkat", "A dobře ji tak.", "blbka zaslouží jedině vyhodit".
OpenClaw nie je jeden konkrétny LLM model (ako napr. GPT či Claude), ale agentický framework a infraštruktúra – „orchestračná vrstva“ alebo „záprah“ (rozhranie), ktorý prepojuje vybraný mozog/procesor (LLM) so zvoleným lokálnym systémom a komunikačnými kanálmi: A. Gateway (Riadiaca jednotka) / B. Skills (Schopnosti) / C. Pamäťový systém.
Keď užívateľka Meta-email-inboxu nasadila na užívateľské rozhranie Meta-email-inboxu, definovaného OpenClaw-Agenta s dizajnovou inštrukciou typu workflow „Pozri sa na tento inbox a navrhni, čo by si archivoval alebo zmazal, ale nič nerob, kým ti to nepoviem.“ – zabudla vykonať takzvané „ukotvenie workflow“ (ukotvenie reality/realít).
Ide o to že… Riadiaca jednotka (A) je programový proces, ktorý beží na pozadí (daemon) a spravuje relácie, správy a nástroje. Schopnosti (B) sú ako programové rozšírenia, ktoré umožňujú agentovi vykonávať akcie ako čítanie súborov, spúšťanie terminálu alebo ovládanie prehliadača. Pamäťový systém (C) využíva lokálnu databázu a markdown súbory v organizačnom programovom systéme, na ukladanie dlhodobého kontextu a preferencií používateľa.
Ak by užívateľské použitia boli zabezpečené ukotvením dizajnovou inštrukciou typu workflow, znamenalo by to použitie dvojitého agenta Agent-1(Agent2), spôsobom, podobne ako u funkcií. Úlohou argumentu funkcie je kontrolovať súlad s argumentom funkcie (dizajnovou inštrukciou typu workflow). Inverzné zobrazenie alebo inverzná funkcia k nejakému zobrazeniu (funkcii) f: AB priraďuje prvkom množiny B prvky z množiny A, teda priraďuje obrazom zobrazení f ich vzory. Inak povedané, inverzné zobrazenie zobrazuje „opačným smerom“ ako pôvodné zobrazenie.
Systém pre inverzné zobrazenie a dvojitého agenta presne pomenúva to, čo v agentickej architektúre nazývame „Deterministic Verification Layer“ (Deterministická overovacia vrstva). V prípade incidentu s inboxom riaditeľky Mety zlyhal OpenClaw práve preto, že fungoval ako priama funkcia bez spätnej väzby, ktorá by overovala vzor (pôvodný úmysel): „ukotvenie workflow“ ... Agent-1 (Generátor/Akčný člen): Vykonáva funkciu. (Navrhuje zmazanie e-mailu na základe kontextu)... Agent-2 (Argument/Kontrolór): Vykonáva inverzné zobrazenie. Pýta sa: „Ak by sa vykonala akcia (zmazanie), je výsledný stav v súlade s pôvodnou inštrukciou ('nič nemaž bez potvrdenia')?“... Logické hradlo (Ukotvenie): Ak sa inverzná funkcia f_-1(f(x)) nerovná pôvodnému (bezpečnostnému obmedzeniu), proces sa musí fyzicky zastaviť na úrovni kódu (Gateway), nie na úrovni halucinácie LLM.... Väčšina súčasných agentov trpí „stratou vzoru“. Akonáhle agent začne vykonávať sekvenciu krokov (B, C, D...), postupne stráca väzbu na počiatočný stav (A). Navrhované riešenie by vyžadovalo, aby každá „Schopnosť“ (Skill) v OpenClaw mala definovanú svoju inverznú operáciu alebo kontrasignatúru.
Zjednodušené „napríklad“... Namiesto jednoduchého príkazu delete_email() by musel systém vynútiť... (I) Pred-podmienka: Existuje v pamäti (C) explicitný súhlas pre ID správy? (II) Inverzná kontrola: Agent-2 (bežiaci na inom, menšom modeli, napr. Llama 3 8B) skontroluje logy Agenta-1 predtým, než sa odošle API požiadavka. Tento koncept „dvojitého agenta ako funkcie“ by v podstate vytvoril imunitný systém pre autonómne AI, kde by jedna inštancia neustále projektovala následky akcií späť na pôvodné pravidlá.
Bolo by možné vo vysvetľovaní problematiky pokračovať hlbšie, ale napriek stručnosti, je tu dobrá „Orientácia a Navigácia“ pre „AI kruhy, vzájomne podmienené a prepojené“… Táto problematika skrz prístup „Deterministická overovacia vrstva — Prečo je "Inverzné zobrazenie" v AI kľúčové?“ je veľmi zaujímavá, a korešponduje s významom a prístupom „záznam modus operandi z reality A do reality B s jasnosťou pochopenia hraničiacej s istotou“, o ktorom som sa vyjadroval v komentári k správičke s názvom „Nepoužívejte hesla generovaná AI, nejsou bezpečná“ (tu na webe ROOT: 20.02.2026)… príklad s IQ testom pre agenta (generovanie chaosu s vysokou Shannonovou entropiou) je dokonalou analógiou pre to, čo OpenClaw v prípade inboxu riaditeľky Mety neurobil… 1. Rozdiel medzi Emuláciou a Exaktnosťou… 2. Inverzné zobrazenie ako „Letový zapisovač“ (CVR/FDR)… 3. Entropia ako strážca integrity… Záver: Smerom k "Deterministic Agency"…
Když si tak uvědomím, kolikrát AI v konverzaci zapomněla, že to, co mi předkládá, jsem odmítl už o několik reakcí předtím. Nebo kolikrát zapomněla, jestli mi má tykat nebo vykat. Nebo se bavíme česky a pak najednou přejde do angličtiny.
Tak mě to, že zapomněla, co bylo původním úkolem, vůbec nepřekvapuje.
Protoze ... to neni AI.
Porad se bavime o statistickym modelu. A ten model si nepamatuje o cem se stebou bavil. On ti je mozna schopen zobrazit nejakou historii, ale neni to kontext jeho vyhodnocovani, ten vypada uplne jinak.
Ted me napada, krasnej priklad ... na yt hromada lidi dava minusy AIckovym vytvorum ... a presto je to AIcko porad vsem cpe. Zato kanaly ktery mam v odberech mi to klidne nenabizi vubec, takze je musim prochazet rucne.