Vlákno názorů k článku Hodí kostkou a prostě vypnou datacentrum. Přežil by Facebook zásah hurikánem? od KarelE - Facebook je trochu specifický v tom, co jeho...

  • Článek je starý, nové názory již nelze přidávat.
  • 20. 3. 2019 11:45

    KarelE

    Facebook je trochu specifický v tom, co jeho datacentra dělají. Takže s tím vypínáním asi trochu výjimeční budou. Každopádně v podnikové praxi to výjimečné není. V USA na to dokonce mají legislativu. Nejsem si jistý kterých všech firem se týká, ale pro velké firmy spravující finanční transakce to každopádně platí.

    Podle té legislativy se alespoň jednou do roka musí provést test, kdy se primární datové centrum natvrdo odpojí. Po odpojení musí automaticky dojít k přepnutí na záložní systém. Provede se sada testů. Po nich se opět připojí primární datové centrum. Automaticky dojde k synchronizaci a přepnutí na primární systém.

    Ověřuje se:

    1. Zda naběhne záložní systém (říkají tomu Disaster Recovery Box a obvykle bývá v jiném městě nebo i jiném státě)
    2. Zda v záložním systému jsou veškeré transakce, které proběhly v primárním systému
    3. Že v záložním systému lze pracovat
    4. Zda po znovuzapojení primárního systému dojde k přepnutí na něj
    5. Že se veškeré transakce, které proběhly v záložním systému, přepsaly do primárního systému

    Co jsem se setkal s firmou pracující s AS/400, tak tam odpojení znamenalo vypnutí napájení switche a vytažení UPS ze zásuvky. UPS pak server sama řízeně vypnula, aniž by se o tom okolí dozvědělo jinak než tím, že spadlo síťové spojení. Rychlost přepnutí byla v nižších desítkách sekund a míra komplikací spočívala v tom, že uživatelům spadlo spojení a museli se znovu přihlásit do aplikace. U systémů s autologinem se to tedy projevilo jen tím, že třebas 15 sekund nefungovaly. Že rázem celá firma fungovala na serverech v Amsterodamu a ne v Londýně, nikdo kromě lidí z IT ani nepoznal.

    Tak nějak jsem žil v domění, že tenhle test musí v USA alespoň jednou do roka absolvovat každá větší firma. Jenže teď když to hledám tak to vypadá, že firma si může svobodně vybrat, zda nějaký Disaster Recovery box má nebo ne. Teprve pokud se rozhodne, že ho mít bude, tak teprve pak pro ní začne platit zákonný požadavek na to ho jednou do roka otestovat. A můj neprávnický názor na americkou legislativu se nyní kloní k tomu, že vlastně jen musí otestovat, že tím nikdo nedokáže zfalšovat transakce - tedy že se nemůže stát, že by někdo překopl spojení, provedl transakce na záložním systému a po opravě kabelu by se ty transakce nějak ztratily.

    http://www.informit.com/articles/article.aspx?p=677910&seqNum=1

  • 20. 3. 2019 21:44

    Uncaught ReferenceError:

    u nás tohle pravidelně provádějí některé bankovní instituce, je to vždy taková chvíle ticha (a freeze) na pár dní :). Většina infrastruktury v ČR, kterou jsem viděl je ale zpravidla active-standby.

  • 21. 3. 2019 12:34

    Trident

    Bohuzel korektni shutdown signalizaci z UPS neni real-life scenar pro DR (minimalne je naivne postaven). Casteji se stava ze treba cela UPS bouchne nebo bouchne vice jedna cela power rail ( vetsi systemy maji vice nez 2 privody ), nenaskoci nebo chcipne diesel ci pokud uvazujeme lidsky faktor (velmi opominana vec jako spatne zapojeni nebo soubezne prace na vice privodech) tak napajeni muze upadnout cele. A to se bavime jen pokud se jedna o izolovany system bez dalsich navaznosti jako externi storage apod.