Vlákno názorů k článku Výpadek Facebooku způsobila chyba v interním nástroji při rutinním zásahu od Filip Jirsák - Zajímavé je, jak podobný je tenhle výpadek loňskému...

Článek je starý, nové názory již nelze přidávat.

6. 10. 2021 19:19

Filip Jirsák

Zajímavé je, jak podobný je tenhle výpadek loňskému výpadku Google.

Ve Facebooku vznikla chyba v nástroji, který má řídit kapacitu v globální síti Facebooku. V Googlu byl problém s nástrojem, který řídí kapacitu jednotlivých služeb (hlídá počty požadavků). V Googlu omylem pro autentizační službu nastavili limit požadavků na nulu; ve Facebooku chtěli zjistit kapacity globální sítě, místo toho se všechna spojení zrušila (dost možná nastavili jejich kapacity na nulu). V obou případech mají nad těmito nástroji audit nebo testování, to ale v obou případech obsahovalo chybu a chybné nastavení/příkaz propustilo. V Googlu se to přímo týkalo autentizační služby, která měla najednou limit na počet požadavků nastaven na nulu, takže se nešlo nikam autentizovat – tudíž ani systémy Googlu a správci se nemohli autentizovat vůči jiným systémům a provádět změny. Zaměstnanci Facebooku se také nemohli dostat k serverům, protože interní síť nefungovala. V obou případech se tedy podařilo problém vyřešit až když se správci dostali fyzicky do datacentra – Googlu stačilo dostat se do jednoho, kde navýšili kapacitu autentizační služby, Facebook se zřejmě potřeboval dostat do více nebo možná do všech datacenter.

Zdá se, že nástroje na hlídání přetížení systému jsou dobrý sluha, ale zlý pán.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 6:34

Pavel Stěhule

Čím komplexnější systém je, tím komplexnější chyby ho sundají, a tím hůř se tyto chyby dají detekovat dopředu a testovat. Existuje teorie systémů, která jestli si vzpomínám tvrdí, že jediným řešením je dělení systémů na co nejvíc izolované subsystémy s jednoznačně definovaným rozhraním. Což jde proti efektivitě údržby i proti efektivitě vývoje, i proti efektivitě provozu.

Nebo na to jít jinak - jednoduché věci se nerozbíjejí, a pokud ano, tak se dají snadno opravit.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 9:26

nil nil (neregistrovaný)

@Pavel Stěhule

Pokud vyjdu z informací pana Jirsáka, tak ve Facebooku evidentně tento scénář netestovali po tom, co se to stalo Google, když už využívali stejné řešení ...

Dalo by se dokonce sarkasticky dodat, že testovat výpadky na lidech jim problémy nedělá, podle před několika lety uniklými dokumenty: Odstavovali různé skupiny lidí od připojení a testovali jejich chování.
7. 10. 2021, 09:27 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 11:52

Filip Jirsák

Poleno [pod redakčním dohledem]: On to není „tento scénář“ – těch scénářů, kterými mohlo dojít ke stejným důsledkům, jsou tisíce. A není to „stejné řešení“. Jenom se to prostě shodou okolností týkalo podobných věcí. Nebo pokud jste scénářem myslel „nemůžu se dostat do datacentra“, tak evidentně na to obě společnosti nouzový postup mají a fungoval. A asi nemá moc smysl snažit se ten postup urychlit a tím jej učinit méně bezpečným. Spíš se budete snažit, abyste ten postup používal méně často.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 13:46

nil nil (neregistrovaný)

@Filip Jirsák

Opravdu tisíce? (pokud tedy neberu, že nějaký nástroj lze bloknout nekonečným množstvím způsobů ... - jde o to, kdy je bloknutý)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 9:26

Zdeno Sekerák

Tohle je vzdy balance mezi efektivitou a jednoduchosti. A nema viteze.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 11:24

Filip Jirsák

Zdeno Sekerák: No hlavně některé věci se prostě jednoduše dělat nedají.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 12:16

Pavel Stěhule

Já si myslím, že dost věcí se dá dělat jednoduše, jen se včas musí říct, že se vymýšlí pí****, a že je lepší jít na to jinak. Zrovna v IT, kde ta komplexita není na první pohled vidět, a kde každý obchodník umí prodat všechno a každý programátor umí všechno naprogramovat a každý architekt všechno navrhnout je tohle extra průser. Věci, které se nedají jednoduše udělat jsou obvykle blbě vymyšlený nebo nedomyšlený.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 13:17

Bez Podezdívky

Často je to, řekl bych, tak, že vymyslet věc jednoduše (a zároveň elegantně a robustně a ...) je složité :-).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 14:36

Lukas1500

Často je to, řekl bych, tak, že vymyslet věc jednoduše (a zároveň elegantně a robustně a ...) je složité :-).
A vymyslet věc složitě a těžkopádně je jednoduché :-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 16:21

Filip Jirsák

Ano, často se věci dají dělat jednoduše. Ale někdy to prostě nejde. A zrovna tyhle globální sítě Facebooku a Googlu jsou příkladem toho, že abyste mohli některé věci dělat jednoduše (provoz cloudových služeb), musíte pod tím mít relativně složitý mechanismus pro správu té sítě. Vlastně celý obor IT je způsob, jak se vypořádat s komplexitou – a zatím jsme nepřišli na lepší řešení, než ty komplexní části co nejvíc izolovat od zbytku a zapouzdřit je do něčeho s jasným a jednoduchým rozhraním.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 17:35

nil nil (neregistrovaný)

@Filip Jirsák

Zapomněl jste na peníze. Pevně věřím, že sousta z toho relativně složitého mechanismu pod <tím> ... nemá co dělat s komplexitami provozu cloudu, ale jsou to prostě další spletité hromady/vrstvy, protože byly levnější a rychlejší než něco předělat či opravit, případně oboje ... to je úplně všude a dokonce bych i řekl, že pokud to nebude nejčastější modus operandi, tak druhý nejčastější ...
7. 10. 2021, 17:36 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 12:24

Lukas1500

Některé věci se třeba ani jednoduše dělat nechtějí.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2021 20:33

Zdeno Sekerák

Jj takzvany svaty trojuhelnik: jednoduchost, efektivita, bezpecnost. Nemuzes mit vse najednou.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 10. 2021 11:39

Lukas1500

jednoduchost, efektivita, bezpecnost. Nemuzes mit vse najednou.
O tom nejsem přesvědčen. Jistě je mnoho případů, kdy jednoduché řešení je zároveň efektivní i bezpečné. Řekl bych, že krátký a jednoduchý program může být efektivnější i bezpečnější než složitý kód plný zbytečných úseků a různých rovnáků na ohýbák.

Vzpomínám si na jednu konzolovou aplikaci, která vyžadovala instalaci .NET frameworku a když jsem se ptal autora na důvod, odpověděl, že to je kvůli možnosti změny barvy textu (což se, pokud vím, dá udělat i bez .NETu).

Ze své zkušenosti vím, že nejhorší jsou narychlo "naprasené" kódy, u kterých si řeknu, že až bude čas, tak je přepíšu lépe...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Výpadek Facebooku způsobila chyba v interním nástroji při rutinním zásahu od Filip Jirsák - Zajímavé je, jak podobný je tenhle výpadek loňskému...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Hledala dokonalý šálek, našla životní vášeň a učí pít kakao

Kdo se bude moct vyhnout EET a co bude muset splnit?

Začínající podnikatel: Základní pojmy z účetnictví

Divný hrnec, záhadný projektor. Tipněte si, na co se používaly

Bitcoin snadno koupíte i bez záznamu. Poradíme jak

30 % nákladů díky AI dolů, ale nuda v práci jde nahoru

Malware, ransomware a další online hrozby: Jak se liší?

AI jako soudce – zákon na prvním místě

Stát dá svobodu důchodcům, které držel ve III. pilíři

Co chceme od AI asistentů? Návrhy odpovědí a třídění pošty

Registrace zaměstnance od 1. dubna 2026 pro účely JMHZ

Počet nových pracovních míst prudce klesá

V Evropě roste zájem o alternativu k Microsoftu, říká Petra Novotná

USA chystají web na obcházení blokací obsahu

Sailfish OS na Sony Xperia 10 III: seznámení a instalace

České firmy pod náletem kyberútoků. Počet vzrostl o pětinu

Výjimka z EET je nejmenším OSVČ k ničemu, hodí se ale podvodníkům

Kdy a jak podat přiznání, aby vám přeplatek vrátili co nejdřív?

Notepad++ opravil chybu zneužívanou k šíření malware

Strojové učení slibuje rychlejší a levnější vývoj baterií