Zrovna ted resim monitoring nove infrastruktury objevil jsem ted Netdata:
https://github.com/firehol/netdata
Demo sites:
http://my-netdata.io/#demosites
Netdata mám aktuálně nasazený na serveru. Hodně se mi líbí. Nicméně je celkem náročný na RAM, pokud chceš držet historii třeba měsíc zpět. Na githubu mají dokonce vzorec podle kterýho si můžeš spočítat využití RAM na základě délky historie.
Taky se mi nelíbí, že je až příliš zaměřený na grafy. V podstatě není připravený na jinou reprezentaci dat než grafem. Avšak oceňuji možnost si velice snadno v HTML udělat vlastní dashboard.
Jsem rozhodnutý pro odchod z netdata. Nástroj je (na rozdíl od všech ostatních) velmi pěkně graficky zpracovaný. Nicméně si nedokážu představit, že by zavolal zákazník, že někdy něco nejelo a já se z těch grafů pokusil vyčíst proč.
Každopádně pokud někdo nemá na monitorovací nástroj vysoké nároky a chce pěkný design, tak určitě doporučuji ;)
netdata je to nejefektivnější na sběr metrik ze systémů co jsem potkal. Pokud chceš historii, máš k dispozici konektory a můžeš je napojit, elk (elastic+kibana+logstash), influxdb atd.
Držet historii v paměti v netdata je šílenost, k tomu určená není, její gui je primárně na realtime sledování.
Pokud ti zákazník musí volat, že je nějaký problém, měl bys více zapracoval na monitoringu a alertingu, ušetří ti to práci a přidá renomé.