Pracoval jsem se Zabbixem skoro 2 roky a mam s nim jenom spatne zkusenosti. Je to monoliticky moloch se zastaralym web UI. Grafy jsou totalne nepouzitelne. Je mozne pouzivat Grafana, ale to uz clovek muze rovnou nahradit cely Zabbix necim jinym. Doporucuji se podivat na reseni jako je Prometheus, Sensu, InfluxDB a vytvorit si svuj tzv. Kompozitni monitorovaci system (composable monitoring) slozeny s casti, ktere jdou v pripade nespokojenosti nahradit necim jinym. Monoliticky monitorovaci system jako je Zabbix nema budoucnost.
Já jsem naopak se Zabbixem velmi spokojený, agent lze suprově rozšiřovat, takže s ní monitoruji nejen sítě, weby, ale i třeba bioplynové elektrárny. Je ale pravda, že out of the box toho moc neumí a člověk si musí monotorovací šablony dost přizpůsobit, aby s nimi byl spokojený. Pokud bych chtěl udělat nějakou jinou vizualizaci, tak není problém si pro hodnoty šáhnout přímo do DB.
Mate s nekterymi z uvedenych dlouhodobejsi zkusenosti (monitoring pres agenta/ SNMP, tiskarny, switche, ...)? Ono kazdy monitorovaci software ma sve klady i zapory a az po case provozu clovek zjisti, jak na tom dane reseni je.
Sam mam dlouhodobe zkusenosti s Nagios/ Icinga z rozsahleho prostredi a tak vim, ze ani tohle neni 100% to, co bych potreboval.
My jsme prošli velkou řadu nástrojů - WhatsUp Gold, Cacti, Nagios, LibreNMS, Munin, DataDog - každé trochu na něco jiného Zabbixem se nám podařilo vcelku všechno sloučit do jednoho, neříkám, že je to dokonalé řešení, ale výhoda mít vše v jednom je veliká. Pro naše použití je to dostatečně dobré řešení.
Na serverech mám agenta a napsáno pár skriptů, které vytáhnou doplňkové informace. Info z tiskáren, routerů a switchů tahám přes SNMP, na běžně nemonitorovatelné věci používám extra vrstvu s Redis, do které sypu další data a zabbixem je vyčítám. Nagios/ Icinga mají výhodu že jsou více zaměřené na služby a tak si jde rychlým pohledem udělat přehled nad důsledky jednotlivých hlášení, v tom Zabbix trochu ztrácí, ale nový dashboard to trochu dohání. Na monitoring webových aplikací je také samozřejmě lepší třeba NewRelic, ale i v Zabbixu poznám že je nějaký problém. Jediné co jsem Zabbixu zatím nesvěřil jsou logy, to umí lépe ELK.
Jsem zastánce spíše monolitického řešení, do kterého mohu dodělat podporu toho co mi chybí, ale to je každého rozhodnutí.
Pro lepší řešení logů společnost Datasys poskytuje logmanagement ELISA jako Security Operations Center v kombinaci s ZABBIX jako Network Operations Center.
Vice na
http://logmanagement.cz/
nebo
http://www.datasys.cz/sluzby/bezpecnostni-monitoring-log-management-siem