Vlákno názorů k článku
Výpadek AWS byla chyba souběhu dvou procesů, které se starají o DNS od Ivan Brezina - AWS (US-EAST-1) DynamoDB Outage report explained in plain...

  • 28. 10. 2025 11:32

    Ivan Brezina

    AWS (US-EAST-1) DynamoDB Outage report explained in plain English.

    1. A race condition in DynamoDB’s DNS automation deleted its main endpoint record.

    2. This happened when 2 DNS systems updated Route 53 at the same time and removed all IPs.

    3. DynamoDB went offline, and services that depend on it like EC2, Lambda, Redshift, and IAM stopped working.

    4. EC2 could not launch new instances because it uses DynamoDB to track server state.

    5. Network and Load Balancer systems failed next, causing connection errors across AWS.

    6. Engineers fixed the DNS issue, full recovery took about 15 hours.

    If you are a DevOps or Cloud Engineer, this is a great use case to understand.

    A small DNS automation glitch can bring half the internet down.

    V Cloudu ma kazda sluzba vlastni sit a CIDR rozsahem, ktery nemusi byt unikatni.
    Private endpoint je IPcko ve vasi siti, ktere reprezentuje sluzbu z jine site. Je to IPcko pres ktere se NATuje pristup k jine sluzbe. V tomhle prepade to byla IPcka DNS serveru.

    Jak se zda tak v jednu dobu bezely dva terraformy, ktere nejak manipulovaly s temi endpointy a vysledkem te operace bylo, ze vsechny DNS endpointy byly smazany.

    Neni to tak davno co si nejaka firma odpalila DNS a pak zjistila, ze bez DNS nefunguje AD (v prepade AWS IAM) a bez access managementu se neda DNS opravit.

  • 28. 10. 2025 13:29

    Filip Jirsák
    Stříbrný podporovatel

    Není potřeba si vymýšlet, co se stalo. Ve zprávičce je odkaz na post-mortem analýzu od Amazonu, kde je to podrobně popsané.