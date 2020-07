Hlavní stránka Seznam.cz, pro mnoho lidí v ČR synonymem Internetu, měla již delší dobu pod každým článkem z feedu v spodní části stránky tlačítko „Líbí se“. Jedná se o jednoduchý a užitečný nástroj, kterým uživatelé mohou dát snadno najevo, jaký obsah se jim libí a tudíž o něj mají zájem.

Jelikož chceme mít ve feedu co nejkvalitnější výběr článků pro každého uživatele, logicky další krok bylo přidat toto tlačítko také na další služby Seznamu (Seznam Zprávy, Novinky, Sport…) a nabídnout ho partnerům, kteří také dodávají do feedu obsah.

V době, kdy jsme tento krok zvažovali, byla ale logika tlačítka Líbí se úzce svázána s fungováním samotné stránky seznam.cz, využívající tu samou databázi, backend, a s UI úzce integrovaným do frontendu celé služby.

Na první pohled nejsnazší cestou by bylo vytvořit samostatný frontend pro tlačítko, který by pak bylo možné integrovat do libovolné služby, ovšem tuto cestu jsme rychle zavrhli z jednoduchého důvodu: množství provozu.

Hlavní stránka Seznam.cz průměrně obsluhuje přibližně 1 400 požadavků za sekundu (požadavky na statický obsah nepočítaje), ve špičkách se toto číslo dokáže vyšplhat i nad 3 000. Náš odhad očekávané běžné zátěže v případě spuštění na všech službách Seznamu a službách partnerů byl přibližně 6 000 požadavků každou sekundu.

Jedním z problémů vyplývajících z takové zátěže je škálování databáze. Databázový cluster pro hlavní stránku seznam.cz je postaven způsobem a na technologiích, které vyhovují potřebám a způsobu použití pro hlavní stránku, ovšem pro toto tlačítko je vhodnější zvolit řešení, které neposkytuje sice některé rozšířené funkcionality, ale umožňuje lepší horizontální i vertikální škálování.

Jelikož jsme chtěli zvolit řešení, které bude možné flexibilněji a snadněji škálovat, vysoká zátěž nebude mít negativní dopad na hlavní stránku seznam.cz a bude postavené na vhodnějších technologiích pro tuto službu, rozhodli jsme se jít cestou samostatné služby, která bude úplně oddělená od hlavní stránky seznam.cz.

Vytvoření plánu boje

Než jsme se pustili do tvorby služby, nebo návrhu architektury, bylo nejdřív nutné si zjistit potřebné informace pro výběr vhodných technologií, zajistit dostupnost potřebného množství výpočetních zdrojů a udělat si seznam všech drobných úkolů, co se musí splnit, aby bylo možné službu spustit.

S výběrem vhodné databáze jsme zašli za sysadminy Skliku, jelikož mají nejvíc zkušeností s provozem úložiště pro službu, která má řádově tak vysokou zátěž, jako jsme očekávali v plném nasazení a spuštění. Tou dobou připravovali do Seznam cloudu SCIF (Seznam Compute Infrastructure) službu MySQL/MariaDB as a Service. Po krátké konzultaci ale vyplynulo, že použití MySQL/MariaDB pro tuto službu by nebylo ideálním, a bylo nám doporučeno použít CouchBase, do začátku se třemi servery zapojenými do clusteru v každém datacentru a XDCR replikací mezi datacentry.

Jelikož řeč byla o třech celých serverech na každé datacentrum, což se vymykalo provisioningu, který jsme tou dobou používali pro stroje v OpenStack části SCIFu, následovala porada s týmem SCIFu, abychom získali potřebné výpočetní zdroje. Navzdory tomu, že se náš požadavek vymykal běžným očekáváním, získali jsme potřebné servery bez problémů a zádrhelů ještě ten samý den.