Tak největší chyba byla ta, že CrowdStrike neměl pořádnou CI pipeline, a že ani jeden počítač v jejich síti takto nezkusili aktualizovat, než tu aktualizaci distribuovali pro "všechny". Je to celkem epic když si člověk představí, co je jejich business.
Doteď jim ty nedostatky procházeli, ale na každého jednou dojde.
mě spíše zaráží, že chybný soubor poslal do kytek celý kernelový modul. Myslíš, že tohle je jediný bug v jejich kódu? Soubor přímo parsuje modul s nejvyššími oprávněními a nenechává to na user space procesu, tohle tak trochu vypadá jako slušná vrata do systému.
Ta chyba při testování nebo chybějící CI mě asi tolik nevadí, to je provozní selhání a to se může stát.
Tohle je vlastnost widli, kuprikladu kdyz v tuxovi zkusis loadnout vadnej modul, prevazne ti to odstreli jen ten modul, zatimco widle lehnou cely.
Neni ani zadnou vyjimkou, ze ti widle sejme uplne obycejna aplikace, nemusi mit ani zadny extra opravneni ani bezet jako driver.
Proste kvalitni system ...
a kdo jí má kritickou? Crowdstrike nebo ty jako jejich klient? Uživatel pustil do produkce od Crowdstrike něco, co nebylo jím otestované, to je opravdu velké selhání.
Dnes máme dobu, kdy testování se dává na pozadí a spíše se testuje formou postupného nasazování a sledování jak si to vede (viz i nápravná opatření samotných crowdstrike nebo to, jaké nástroje poskytuje MS). Nová generace vývojářů nemá moc ráda testy a proto bych dneska argumentování, že pokud selže CI, je to kritická chyba nepoužil. Důležitost CI a jeho spolehlivost padá k zemi.
Jak koukám, nikde nevidím, že by Crowdstrike klientům sliboval jak sofistikované má CI, co vše dělá než něco uvolní, očividně jen klienti očekávají, že to má. To je dost naivní přístup.
Jenže uživatel právě NEMÁ kontrolu na aktualizacemi. Takže ten míč je právě na druhé straně hřiště. Postupné vypouštění aktualizací je až plánovaný důsledek této chyby.
Ale se zbytkem souhlasím. Ono to souvisí s komplexitou věcí a rozdílností prostředí. Takže pořádné testování na straně dodavatele je asi příliš drahé v porovnání s benefitem.
Je fakt, že poškození dobrého jména firmy se u soudu dobře prokazuje, ale jenom poškozenému.
V případě viníka management obětuje pěšáky/dělníky/nižší management, trochu si zanadávají na valné hromadě, vypíšou vyšší bonusy za nové/udržené klienty obchoďákům a navzdory štěkajícím psům, karavana jede dál.
"uživatel nemá kontrolu nad aktualizacemi" zní hrůzostrašně, tady samozřejmě se nebavím o domácích uživatelých s notebookem, ale o provozech typu Letiště Václava Havla, kde prostě to nechali jen tak nainstalovat.
I nad aktualizacemi od crowdstrike kontrola být může a nedovedu si dnes představit společnost, která spadá pod ZoKB, která si nechává aktualizace instalovat jakkoliv, kdykoliv jak si vendor usmyslí. To je selhání jejich IT a pravděpodobně porušení ZoKB, pod něj naše Letiště spadá.
Chápu, že menší společnosti nemají peníze a musí se spoléhat na vendora, s tím se moc dělat nedá, teda dá, nepoužívat Windows a technologie od Microsoftu, to je tak extrémně uzavřený svět, že prostě nic jiného než spoléhání nebo vysoké náklady ti nezbývá.
Co se RLP tyce, ti zcela jiste neaktualizuji jen tak neco jen proto, ze nekdo nejakou aktualizaci vydal. A i kdyby jim to cele lehlo, nedeje se vlastne nic, protoze staci zvednout telefon, a prevezmou to sousedi.
Ve finale, a kupodivu, existuji i postupy, jak se maji piloti chovat, kdyz rizeni kontaktovat nelze. Takze v tomhle oboru se da rict, ze veci jeste funguji, a pocita se s tim, ze neco muze nefungovat.
Dycinky me potesi, kdyz predemnou stoji tatar co u sebe nema floka a dohaduje se s pokladni, jak to ma zacalovat, kdyz mu karta (z libovolneho duvodu) neda. Pokazdy mam neodbytny nutkani vytrcit svou pravou nohu smerem v pred.
Ono tech crashu, false positives a podivnych side efektu bylo spousta.
Kdo s timhle SW ma zkusenosti tak to muze potvrdit.
Buhuzel se to tlacilo na silu uplne vsude a securitaci se vymlouvali, ze admini jsou az moc paranoidni.
PS: Nastesti to malokdy uplne odstrelilo produkci, vetsinou kvuli tomu padal SW uz pri instalaci. Anebo to nahodne blokovalo Ansible automatizaci.