Zabix je staromodni monoliticky system velmi podobny Nagiosu a jeho odnozim jako napriklad Cacti. Na svete neexistuje jediny monitorovaci system, ktery by dokazal monitorivat vsechno. Proto se vetsina lidi uchyluje k tvorbe kompozitniho monitorovaciho systemu, ktery je slozeny z vice komponent, ktere spolu nazajen spolupracuji a kazda z nich lze nahrati jinou, pokud prestane vyhovovat. Ja si podobny system sestavil z Collectd (kolekce metrik a vyhodnocovani thresholdu), InfluxDB (timeseries databaze), Sensu + Uchiwa (alerting dashboard) and Grafana (graphing dashboard). Vrele doporucuji vyzkouset.
> Na svete neexistuje jediny monitorovaci system, ktery by dokazal monitorivat vsechno.
S tym by som suhlasil.
> Proto se vetsina lidi uchyluje k tvorbe kompozitniho monitorovaciho systemu, ktery je slozeny z vice komponent
Vo velkych korporacia sa tlaci myslienka "unifikovaneho" monitoringu,tam takymto sposobom nie su moc nakloneny - ibaze sa to zabali do buzwordu microservices ;-)
Z vasho stacku by som vyhodil InfluxDB - su dobri, ale este skaloval nevedia dostatocnev - pri vyssich poziadavkach na nvps bude problem (CERN publikoval nejake porovnania kde InfluxDB jednoznacne pohorel v tomto smere - na SME monitoring je vsak OK). Mozno v buducnosti. Takze asi klasika OpenTSDB (HBase). Alebo by stalo za skusenie "sialena", avsak realna myslienka - pouzit ako storage Elasticsearch a potom Kibanu (davny predok Grafany) na grafy,
Porovnani co provadeli v CERNu je uz skoro rok stare. Od te doby se InfluxDB hodne zlepsil. Posledni verze by mela umet ukladat data s frekvenci 350 tisic zaznamu za sekundu (https://influxdata.com/blog/announcing-influxdb-v0-10-100000s-writes-per-second-better-compression/).
Presne tak, CERN sice nepise aku verziu skusali, no podla casu kedy to robili to bolo asi 0.8. Performance ako features boli v tom case uplne inde ako su teraz. S novym TSM storage engine je to velmi rychle a data zaberaju malo miesta, kedze sa pouziva kompresia (udajne priemer je cca 3 byte / hodnota ).
Pokud nekdo touzi po lepsi vyzualizaci, existuje Grafana-zabbix :-)
https://github.com/alexanderzobnin/grafana-zabbix
Je mozno Dockerizovat
https://www.zabbix.org/wiki/Dockerized_Zabbix#Grafana_with_Zabbix_datasource
Vybudování a dlouhodobá údržba takovéhoto "vlastního" monitorovacího systému jsou činnosti extrémně náročné na lidské zdroje. To je práce pro tým velmi kvalifikovaných lidí, který nedělá prakticky nic jiného. S tím by nás naprostá většina zákazníků kvůli vysokým nákladům vyhodila - naopak zdařile fungujeme jako komerční poskytovatel služeb k monitorovacímu systému ZABBIX, příležitostně i k NAGIOS.