Vlákno názorů k článku
Výpadek AWS byla chyba souběhu dvou procesů, které se starají o DNS od RDa - Tak ono staci se podivat trocha na coalescing......

Článek je starý, nové názory již nelze přidávat.

27. 10. 2025 13:26

RDa

Tak ono staci se podivat trocha na coalescing... jak ty zavisle ukoly planovat tak, aby se to nezahltilo.

Problem je velice podobny tomu s cim se musi vyporadat napr cron - pokud ukol trva dele nez hodinu a mate to naplanovano v hourly, tak jaky pristup zvolit? Nasilne dodrzovat plan, ze se to bude poustet co hodinu ale riskujete zahlceni.. anebo se pozadavek vypusti, kdyz dana vec se nestihla dokoncit v ramci sveho periodickeho okna?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 10. 2025 15:21

czechsys

A zrovna tu vec s cronem resi elegatne systemd timer.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 10. 2025 15:25

Heron

To jednak, ale už dinosauři programovali tak, že si to hlídalo samo, zda to neběží dvakrát. Potom se to z cronu dá spouštět každou minutu a poběží to pouze jednou.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 10. 2025 16:55

Uncaught ReferenceError:

doporučuji tohle vyzkoušet, když máš výraznou zátěž (např. násobky počtu jader), pak se ty cron procesy umí přednánět, flock nebo listen socket v tom udělají pěkný čurbes a neplatí, že to běží jen jednou. Naopak u systemd timer se mi tohle nestalo.

Jako dinosauři jsme s tímhle právě problémy měli.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 10. 2025 21:31

JMarek

if [ -f lock.file ]
then
touch lock.file
delejNecoUzitecneho.sh
rm lock.file
fi

Lépe (atomicky) to tedy neumím...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 10. 2025 1:45

Wasper

* * * * * /usr/bin/flock /run/nejakej.lck delejNecoUzitecnehoJednou.sh
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 10. 2025 7:23

Martin B.

No tohle ty neprůstřelné rozhodně není. V těchto scénářích kdy check a vytvoření zámku nejsou atomické se obvykle používá dvojitý check
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 10. 2025 7:18

Radovan.

Jakože je tak náročný problém, aby si program při spuštění nejdřív zkontroloval, jestli už neběží?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 10. 2025 7:22

Heron

Není. Vytvoření souboru na FS je atomická operace. Lock soubory se v unixu používají v podstatě od počátku.

Man pro open: O_EXCL - Ensure that this call creates the file: if this flag is specified in conjunction with O_CREAT, and pathname already exists, then open() will fail.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 10. 2025 8:25

karl82

Jé doufám jasný, že tydle “procesy” jsou distribuovaný systémy/služby a ne lokální process co se spouští přes crond?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 10. 2025 9:53

Heron

Reagoval jsem ve vláknu, kde někdo uvedl cron. Pokud distribuovaná služba nepozná, že na stroji běží proces stejné služby spuštěné někým jiným, tak je to špatná služba.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
2. 11. 2025 13:04

karl82

OK. Máš naivní představu o distribuovaných službách a systémech.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 10. 2025 9:30

Bel Shamharoth

Hlavně to, prosím, neříkejte mému wrapperu na crony, jo? Ještě by se tak po těch letech bezchybného provozu začal chovat.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 10. 2025 9:50

Filip Jirsák

Stříbrný podporovatel

Zprávička je o tom, že Amazon měl v automatických úlohách spouštěných na pozadí léta chybu race condition, která se projevila teď po letech a v důsledku způsobila chyby mnoha služeb v nejdůležitějším regionu AWS skoro na celý den. Argument „mně to tak léta funguje“ mi pod takovou zprávičkou připadá poněkud bezzubý.

Že je kód, kde by mohlo docházet k race condition, správně, se neověří tak, že ten kód dlouho poběží bezchybně. Ověříte ho jedině tak, že kód projdete, zjistíte, co dělá, jaké jsou předpoklady toho, co dělá, a ověříte, že všechny ty předpoklady jsou splněné.

Je dost možné, že to tak máte, protože zajistit na Linuxu pomocí zamykacího souboru, že proces poběží maximálně jednou, je jednoduché. (Zajistit, že poběží právě jednou, je úplně jiná disciplína.) Ale „běží to dlouho bez chyb“ to nedokazuje.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 10. 2025 9:55

Bel Shamharoth

Ne, zprávička je o race condition na kterou nikdo jaksi nepomyslel. To, na co jsem reagoval, je tvrzení, které jsem si pečlivě ověřoval a nikdy nic takového nenastalo.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 10. 2025 9:51

Trident

Tyhle tasky na velkých infrastrukturach resi typicky globalni nadřazené job plannery. Nikd pricetny tohle nebude řešit přímo na stroji kde task bezi.
28. 10. 2025, 09:53 editováno autorem komentáře

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Výpadek AWS byla chyba souběhu dvou procesů, které se starají o DNS od RDa - Tak ono staci se podivat trocha na coalescing......

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

USA chystají web na obcházení blokací obsahu

Hackeři útočí přes e-mail, prahnou po přihlašovacích údajích

Desítky rozšíření pro Chrome kradou uživatelská data

Malware, ransomware a další online hrozby: Jak se liší?

Stát se za data retention omluvil, ale údaje sbírá dál

Miliony webů nesplňují zákon o přístupnosti. Jaký hrozí trest?

Strojové učení slibuje rychlejší a levnější vývoj baterií

Pojišťovny zneužívají lenosti svých klientů. Ti za to platí

Deset kroků pro maximální zabezpečení Google účtu

Nervózní Microsoft začal v ČR žehlit Trumpův chaos

Majetkové přiznání dalo ministrům současné vlády zabrat

Plánované změny v penzích: Zjistili jsme další podrobnosti

Analýza rozebrala moderování Jílkové v Máte slovo

Handicap proměnila v úspěšný byznys, učí ženy nosit paruky

Google Pixel 10a má plochý design a vylepšenou odolnost

Z evropského koláče chytrých telefonů ukusují Apple a Honor

Ve firmách se pořád věří jediné „pravdě“ z dat. A to je problém

AI se snaží promlouvat i do stavebnictví

U dědečkova stavu našla smysl a teď oživuje unikátní tkaní

Školkovné se vrací. S jakou obměnou?

Vlákno názorů k článku
Výpadek AWS byla chyba souběhu dvou procesů, které se starají o DNS od RDa - Tak ono staci se podivat trocha na coalescing......