V CERNu monitoruji cca 8000 zarizeni pomoci systemu Lemon (http://lemon.web.cern.ch/lemon/index.shtml). Pokud ale nemate tak 4 lidi, kteri se o to budou starat a psat pluginy, tak nedoporucuji.
UPC je uz velka firma.
Tam bych zvazil neco enterprise, treba Tivoli Netcool Family, co provozujou u T-Mobile a O2.
Obecne problem tech malych udelatek je mizerna podpora skalovatelnosti a HA clusteru. Kdyz udelatko lehne, jsi slepy.
Business zakaznici taky vyzadujou sledovani SLA, coz s udelatky rozumne neudelas.
Na druhou stranu, implementace Netcool vyjde cenove v radech milionu.
ad Business zakaznici a SLA, pouzivame Nagios v kombinaci s Centreonem a pokud mate na mysli sledovani procentualni dostupnosti sluzeb/serveru, tak to Nagios umi.
Stejne tak tato kombinace umi grafy, reporty a tak. Monitorujeme asi 400 serveru, 3000 ukazatelu, stroje s Win/Linux, UPSky atd. V zasade se da monitorovat cokoliv, pluginu existuje hodne, fakt je ten ze vsechny nefunguji idealne, mam pocit ze zrovna pluginy pro cteni WMI a eventlogu na MS strojich.., ale muzeme si je prizpusobit k obrazu svemu (coz snad nekdy i delame:)
Historicky jsme pouzivali jen Nagios, ale jak nekdo zminil, masova konfigurace textovych souboru je pomerne chaoticka, ale Centreon jako nadstavba to hodne usnadnuje, da se pres nej delat snad cokoliv co jde textakama.
V teto kombinaci jdou taky velice slusne nastavit pristupova prava, contact groupy a monitorovane prvky, takze kazdy zamestnanec vidi jen svoje klienty a stroje pokud nema duvod videt vsechno, hodi se to i pro nektere klienty kteri do toho taky chteji videt :-).
Fakt je ten ze prvotni konfigurace neni uplne prehledna, ackoliv je to pres webove rozhrani, tak pokud neco nedelate casto, muzete trochu tapat. Vyvoj je (bohuzel nebo bohudik? :) rychlejsi nez dokumentace, takze ta odkazuje na to jak to fungovalo pred 2 lety ale v aktualni verzi se to nastavuje jinak atd..
Ale kdyz to shrnu, tak to nasazeni melo smysl a v zasade to dela to co od toho chceme