Díky, ta část s disky měla hlavně vystrašit, ale ... disky odcházejí různě, já měl štěstí vždy na pomalejší smrt. Patnáct let mi neodešel jediný disk a během posledních čtyř měsíců se u čtyř začaly objevovat chyby ve S.M.A.R.T.u. V serveru jsem jeden vyměnil téměř hned a ten by možná ještě nějaké hraní snesl, na Desktopu ještě běží, ale chová se divně a občas dělá divný zvuky, v netbooku to byla totálka dost rychle, ale taky předem křičel a v notebooku očekávám totálku každou minutou.
Že se disk vypne a už nezapne jsem slyšel jen z vyprávění, kde prý po letech bezproblémového chodu vyschly ložiska a motor to už znovu neroztočil. Dotklo se to všech disků v poli.
Pokud máte velká a rozsáhlá disková pole (tedy šuplata - externí shelfy) plná disků, zjistíte, že není vůbec nic mimořádného, že prostě disk odejde. Ve firmě používáme hardware od HP a máme na něj napsané vlastní skripty, které vyčítají z diagnostiky serveru varování a chyby. Skoro vždycky se u vadného disku vyskytnou nějaká varování a pak disk umře. Prostě jen tak.... A je po něm. Bohužel, znám i disky, které vesele hlásí varování a do věčných lovišť neodchází. Takže záleží na tom, jak je nastavená firemní politika, co do výměny potencionálně vadného hardware. Otázka nakonec skoro vždy zní: vyměnit, nebo ne (a většinou je odpověď: vyměnit co nejdříve).
Jinak Nagios je bezva, jen občas neohrabaný. Pokud máte spravovat desítky serverů se stovkami služeb, tak si užijete konfigurace.... hojně!
Ved prave :)
Este hadam pred rokom bolo cele rozhranie ako staticke html a hromadka cgi sktiptov. Potom prisiel upgrade a hlavna stranka (jeden jediny sk...y subor) bol odrazu php a v nom dva testy na ip adresu a nazov stranky a.p. Kedze som hrdo urobil upgrade ako inokedy tak som len nechapavo zizal... Vyriesil som to tak, ze som ten subor prepisal jeho vygenerovanou html verziou. V dalsej minoritnej verzii mi uz taketo srandy nepomohli, lebo toho kodu tam dali viac. Tak som musel prekopat celu konfiguraciu, pretoze na php virtualhosty mam dost tvrde naroky a tie sa nezlucuju s vykonavanim cgi suborov a citanim skriptov po celom disku... Pridanie php do nagiosu je fail. Usetrilo robotu jednemu vyvojarovi a mne urobilo z konfiguracie peklo.
Nuz len par drobnosty:
- zabezpecenie zacina nie na 7restve ISO/OSI alebo na 4vrstve TCP/IP ale uz aj skor cize naprikald pouzitie iptables je tiez vhodne.
- Neviem preco by monitoring server mal byt dostupny priamo z public internetu? Bez toho aby clovek bol autentyfikovany a aurorizovany uz ked nie inak tak len cez ssh (napirklad spojenie Portknocking/autentyfikacia a autorizacia cez kluce a nie cez hesla/nasledne pristup cez TCP port forwarding). A to nevravim o moznosto VPN ...
- Zaroven ako kazdy normalny admin v ramci firmy meniesa VALN-y ale separuje uzivatelov (USER VLAN) od manageemnt/monitoring VLAN-y. Taktiez oddeluje ostatne datove toky. Potom velmy jednoducho sa daju robit ACL lysty alebo iptables ruly.
Mam 100-200 serveru a sluzeb nekolik tisic. Konfiguraci si uzivam ;-)
Generuji ji ruby skriptem z konfiguracni hashe.
Mam templaty podle typu serveru, ktere obsahuji i monitorovane sluzby. Tim mam taky zajisteno, ze na nejakem serveru nezapomenu nejakou beznou sluzbu monitorovat.
Vzhledem k tomu, ze ma nagios&friends relativne jednoduchy textovy konfigurak, neni konfigurace opravdu problem.
> Pokud máte spravovat desítky serverů se stovkami služeb, tak si užijete konfigurace.... hojně!
Neni to zas tak zly, pomoci sablon se da *hodne* prace usetrit. Taky neni spatnej napad mit konfiguraci v nejakym verzovacim systemu, u vetsiho prostredi se totiz da predpokladat, ze spravu muze delat vic lidi a v tu chvili je changelog zmen k nezaplaceni.