Hlavní navigace

Síťový svatý

1. 12. 1999
Doba čtení: 4 minuty

Sdílet

Správci sítí či internetových serverů asi dobře vědí, jak nepříjemné může být, když něco selže a protože se o tom prostě nedozvíte, nefunguje to třeba několik hodin (v horším případě i dnů - třeba přes víkend). Proto se vyplatí důležité služby monitorovat. Například pomocí programu NetSaint.

Nemálo administrátorů si pro tyto účely vytvořilo vlastní řešení, jenže pokud se před tím pořádně nezamysleli, může se jim stát, že později narazí na některé problémy, jako je například nerozšiřitelnost nebo nejednotná konfigurace různých utilitek a podobně. Vím o čem mluvím, sám jsem měl tu jeden skriptík, který hlídal funkčnost HTTP serveru, tu druhý skriptík, který oznamoval restart serveru, tu další, který hlídal běh toho a toho programu a takhle jsem svůj malý zmatek rozvíjel až do stádia, kdy jsem si řekl dost a podíval jsem se po nějakém hotovém programu.

Nechci tady dnes rozebírat, co jsem vyzkoušel a proč jsem nebyl spokojen, jisté ale je, že nakonec jsem dospěl k programu NetSaint. Musím se přiznat, že ačkoliv mi obvykle nedělá problémy nastavovat téměř cokoliv editací konfiguračních souborů (vyjma sendmailu, to jsem vzdal už před lety :), tak tentokrát mě trošku nalákalo webové konfigurační rozhraní (ale také dobrá dokumentace).


NetSaint samotný lze rozdělit na dvě části. První z nich je vlastní jádro, tedy démon, který běží na pozadí a spouští periodicky podle vaší konfigurace jednotlivé testy. Jeho paměťové nároky jsou minimální, a rovněž procesor není prakticky zatěžován, pokud zrovna nespouštíte padesát testu každou minutu.

Druhou částí jsou zásuvné moduly, které provádí jednotlivé testy. Termín plugin či zásuvný modul zde není tak docela na místě, protože v případě NetSaintu jde o obyčejné programy, které jádro spouští s patřičnými parametry. To má svoje plusy i mínusy. Nevýhodou je, že s každým testem se musí zakládat nový proces. Za obrovskou výhodu naopak považuji to, že pokud vám nebudou stačit moduly ze základní nabídky, snadno si přidáte vlastní, protože nejste limitováni žádnými API, volbou jazyka, zkrátka téměř ničím. V podstatě jediné, co musíte znát, jsou významy návratových kódů aplikace. Například mě nevyhovoval přiložený modul pro kontrolu velikosti volného diskového prostoru, protože limity se udávaly v procentech. Tak jsem si napsal svůj vlastní v shellu:

FREE=$[ `/bin/df -kP $3 2>/dev/null | /bin/grep -v Filesystem \
    | /bin/awk '{print $4}'` ]
FREE=$[ FREE / 1024 ]

WARN=$[ $1 ]
CRIT=$[ $2 ]

echo "$FREE MB free"

if [ $FREE -lt $CRIT ]; then
    exit 2
elif [ $FREE -lt $WARN ]; then
    exit 1
else
    exit 0
fi

CS24_early

Tento test přebírá tři parametry:

 • Dolní hranici velikosti volného prostoru, při jejímž překročení budu varován
 • Dolní hranici velikosti volného prostoru, při jejímž překročení bude oznámen krizový stav
 • Filesystém, který testujeme

Poznámka: vím, že uvedený příklad je docela neefektivní (volání tří externích programů) a nejspíš nebude asi ani přenositelný, ale pro demonstraci postačuje. Jinak je při psaní modulů slušností, aby při spuštění bez parametrů vypsal malou nápovědu.

Standardních modulů pro NetSaint je již přibližně okolo třiceti, seznam a popis naleznete zde. V základní výbavě najdete například Ping plugin, který ověřuje, zda testovaný stroj vůbec běží, moduly, které kontrolují specifickou síťovou službu (POP3, SMTP, HTTP, FTP a další), univerzální síťový test (kontrola TCP nebo UDP portu), ale třeba i modul, který kontroluje velikost paměti, zabrané daným procesem nebo další, jenž ověřuje stav UPS.

Stejně jako testy lze tvořit i vlastní moduly pro oznamování jejich výsledku. Standardně je přiloženo oznamování emailem a na pager (ovšem ve skutečnosti jde oboje přes email). Opět není problém přidat vlastní moduly a s patřičným vybavením třeba posílat přímo SMS na mobil.

Co mi připadá na NetSaintu možná nejzajímavější, je asi organizace informací, s nimiž pracuje – tedy de facto konfiguračních souborů. Pokud mohu skromně posoudit, tak vychází z modelu fungování informační infrastruktury ve velkých podnicích (což neznamená, že NetSaint není vhodný pro hlídání dvou serverů, jenom asi nevyužijete vše).

Základem jsou samozřejmě jednotlivé servery, v terminologii NetSaintu se pro ně užívá termín host. Ty se shlukují do skupin serverů (hostgroups), třeba podle operačního systému. Dále jsou zde pak administrátoři (contacts), kteří se rovněž organizují do skupin adminů (contactgroups). Pak zde máme časové zóny (timeperiods), moduly (commands) a testy (services).

A teď si to spojme celé dohromady. Každý server přísluší do nějaké skupiny serverů, ke které patří jedna nebo více skupin administrátorů, do níž spadá jeden nebo více administrátor, jenž má přiřazenu přesně jednu časovou zónu, která definuje období, v němž je administrátor dostupný. Dále pak existuje seznam testů, které tvoří vazbu mezi testujícím modulem, notifikačním modulem, serverem a opět časovou zónou – ta v tomto případě definuje, kdy se mají testy provádět.

Takhle to vypadá docela složitě, ale není to tak hrozné. Základní vazby jsou celkem pochopitelné a navíc webové rozhraní konfiguraci velice usnadňuje. Na druhou stranu má tato zdánlivá komplikovanost svoje kouzlo. Snadno tak například docílíte toho, aby byl o problému informován vždy ten administrátor, který má opravdu službu, můžete si nechat posílat informace jenom ve všední dny, zajistíte, aby vás SMS zpráva neprobudila v noci. Ošetříte, aby mail o nefunkčním Ciscu nedostal administrátor, který se vyzná jenom v printserverech a naopak, zkrátka fantazii se meze (téměř) nekladou.

Konfigurace programu není příliš složitá, ale chce to nahlédnout do dokumentace, metoda pokus omyl bude v tomto případě znamenat nejspíš jenom zdržení. Hodně také pomůže přiložená vzorová konfigurace.

NetSaint se mi jeví jako zdařilý produkt, který dokáže ušetřit administrátorům práci díky včasnému objevení defektů a firmám i peníze, protože zkracuje délku výpadků klíčových zařízení. Připadá mi velice rozumné program tohoto typu používat a NetSaint mohu z klidným svědomím doporučit.

Byl pro vás článek přínosný?

Autor článku