Suprové!! :-) :-)
Názory k článku
Icinga: monitorování sítí a serverů
Spolehlivost disku
celé vláknoPekny clanek, ale ta cast s disky neni moc z reality. Minimalne polovina disku odejde, aniz by SMART cokoliv ohlasil predem a odejde nahle, vetsinou se problem projevi pri nabehu napajeni. To ma neprijemny dusledek - tam kde je disku hodne jich nekdy umre najednou vice, nez je parita pole.
Re: Spolehlivost disku
celé vláknoDíky, ta část s disky měla hlavně vystrašit, ale ... disky odcházejí různě, já měl štěstí vždy na pomalejší smrt. Patnáct let mi neodešel jediný disk a během posledních čtyř měsíců se u čtyř začaly objevovat chyby ve S.M.A.R.T.u. V serveru jsem jeden vyměnil téměř hned a ten by možná ještě nějaké hraní snesl, na Desktopu ještě běží, ale chová se divně a občas dělá divný zvuky, v netbooku to byla totálka dost rychle, ale taky předem křičel a v notebooku očekávám totálku každou minutou.
Že se disk vypne a už nezapne jsem slyšel jen z vyprávění, kde prý po letech bezproblémového chodu vyschly ložiska a motor to už znovu neroztočil. Dotklo se to všech disků v poli.
Re: Spolehlivost disku
celé vláknoPokud máte velká a rozsáhlá disková pole (tedy šuplata - externí shelfy) plná disků, zjistíte, že není vůbec nic mimořádného, že prostě disk odejde. Ve firmě používáme hardware od HP a máme na něj napsané vlastní skripty, které vyčítají z diagnostiky serveru varování a chyby. Skoro vždycky se u vadného disku vyskytnou nějaká varování a pak disk umře. Prostě jen tak.... A je po něm. Bohužel, znám i disky, které vesele hlásí varování a do věčných lovišť neodchází. Takže záleží na tom, jak je nastavená firemní politika, co do výměny potencionálně vadného hardware. Otázka nakonec skoro vždy zní: vyměnit, nebo ne (a většinou je odpověď: vyměnit co nejdříve).
Jinak Nagios je bezva, jen občas neohrabaný. Pokud máte spravovat desítky serverů se stovkami služeb, tak si užijete konfigurace.... hojně!
Re: Spolehlivost disku
celé vláknoNa Nagios mi vadi provazanost na deravy PHP. Lepsi pozvanku pro hackers si neumim predstavit.
Re: Spolehlivost disku
celé vláknoA tu provazanost na PHP jste vzal kde? Nagios ma (narozdil od noveho rozhrani icingy) porad vetsinu skriptu v CGI. A zabezpeceni pochopitelne zacina u Allow From v .htaccess.
Re: Spolehlivost disku
celé vláknoVed prave :)
Este hadam pred rokom bolo cele rozhranie ako staticke html a hromadka cgi sktiptov. Potom prisiel upgrade a hlavna stranka (jeden jediny sk...y subor) bol odrazu php a v nom dva testy na ip adresu a nazov stranky a.p. Kedze som hrdo urobil upgrade ako inokedy tak som len nechapavo zizal... Vyriesil som to tak, ze som ten subor prepisal jeho vygenerovanou html verziou. V dalsej minoritnej verzii mi uz taketo srandy nepomohli, lebo toho kodu tam dali viac. Tak som musel prekopat celu konfiguraciu, pretoze na php virtualhosty mam dost tvrde naroky a tie sa nezlucuju s vykonavanim cgi suborov a citanim skriptov po celom disku... Pridanie php do nagiosu je fail. Usetrilo robotu jednemu vyvojarovi a mne urobilo z konfiguracie peklo.
Re: Spolehlivost disku
celé vláknoNuz len par drobnosty:
- zabezpecenie zacina nie na 7restve ISO/OSI alebo na 4vrstve TCP/IP ale uz aj skor cize naprikald pouzitie iptables je tiez vhodne.
- Neviem preco by monitoring server mal byt dostupny priamo z public internetu? Bez toho aby clovek bol autentyfikovany a aurorizovany uz ked nie inak tak len cez ssh (napirklad spojenie Portknocking/autentyfikacia a autorizacia cez kluce a nie cez hesla/nasledne pristup cez TCP port forwarding). A to nevravim o moznosto VPN ...
- Zaroven ako kazdy normalny admin v ramci firmy meniesa VALN-y ale separuje uzivatelov (USER VLAN) od manageemnt/monitoring VLAN-y. Taktiez oddeluje ostatne datove toky. Potom velmy jednoducho sa daju robit ACL lysty alebo iptables ruly.
Re: Spolehlivost disku
celé vláknoMam 100-200 serveru a sluzeb nekolik tisic. Konfiguraci si uzivam ;-)
Generuji ji ruby skriptem z konfiguracni hashe.
Mam templaty podle typu serveru, ktere obsahuji i monitorovane sluzby. Tim mam taky zajisteno, ze na nejakem serveru nezapomenu nejakou beznou sluzbu monitorovat.
Vzhledem k tomu, ze ma nagios&friends relativne jednoduchy textovy konfigurak, neni konfigurace opravdu problem.
Re: Spolehlivost disku
celé vlákno> Pokud máte spravovat desítky serverů se stovkami služeb, tak si užijete konfigurace.... hojně!
Neni to zas tak zly, pomoci sablon se da *hodne* prace usetrit. Taky neni spatnej napad mit konfiguraci v nejakym verzovacim systemu, u vetsiho prostredi se totiz da predpokladat, ze spravu muze delat vic lidi a v tu chvili je changelog zmen k nezaplaceni.
Re: Spolehlivost disku
celé vláknoVyměnit nebo nevyměnit a firemní politika? Do každého pole patří Hotspare disk a RAID řadič si rozhodne, kdy vadný disk odpojí a místo něj si vezme ten rezervní.
Loser...
celé vláknoAdministrátor Karel sedí na terase při západu slunce a užívá si prvních slunečních paprsků tohoto roku. Říká si, že tuhle idylku snad může zkazit jenom manželka...
Ubohe a primitivni...
Re: Loser...
celé vláknoOsobně to oceňuju jako decentní fórek.
Vzhledem k tomu, že příběh nepopisuje rodinné zázemí Karla, není možno jej ani soudit.
Re: Loser...
celé vláknoMe to neprijde jako forek a uz vubec ne decentni... :-\
At je zazemi Karla jakekoli, jen 'loser' dokaze takhle uvazovat...
A propo - na co zije pak s manzelkou? At je jeho zazemi jakekoli?
Radeji no comment, pac mozek chlapku je pry ochuzen o jedno pomyslne kolecko a tomu docela verim... :-|
Re: Loser...
celé vlákno> ..jen 'loser' dokaze takhle uvazovat...
>A propo - na co zije pak s manzelkou?
Správně, když si s ní nerozumí, tak se má rozvést, nebo se alespoň odstěhovat k milence. Stěžovat si a nic nezměnit může opravdu jen loser.
rozdil mezi nagios a inciga
celé vlákno..... přes změnu jména je Icinga Nagios jak vyšitý, ale disponuje několika vlastnostmi, které stojí za to umět použít. ...
jakymi vlastnostmi? z clanku jsem pochopil ze to co umi inciga umi i nagios, je pro nej spousta pluginu (pro oba), bezi jako daemon a pluginy(oba).
Re: rozdil mezi nagios a inciga
celé vláknoRozdil je zejmena v UI (a to jak classic UI, ktere ma par kosmetickych zmen znacne zvysujicich pouzitelnost, tak nove Icinga web UI, jemuz jsem zatim neprisel uplne na chut, ale potencial ma), Icinga od verze 1.3 navic podporuje IPv6.
Re: rozdil mezi nagios a inciga
celé vláknoMy pouzivame nagios pro monitorovani ale jako frontend k nemu centreon a spokojenost ;)
Re: rozdil mezi nagios a inciga
celé vláknoMusim rici, ze Centreon je na administraci fajn, jiz ho pouzivam i s Icingou. Na Icinze se mi libi i to, ze jsou tam popUPove komentare.
Re: rozdil mezi nagios a inciga
celé vláknoRozdílů je dost, ještě se o nich rozepíši.
http://www.icinga.org/wp-content/uploads/2010/08/Icinga-vs-Nagios-matrix1.pdf
Re: rozdil mezi nagios a inciga
celé vláknoKdyž už v článku zaznělo něco o pasivním monitoringu...
Za hlavní nevýhodu Nagiosu považuju to, že při distribuovaným monitoringu musím mít hlídaný uzel nakonfigurovaný na podřízeném i nadřazeném serveru (nebo - nedej Bože - na všech vrstvách, když je jich víc).
Jestliže má Icinga stejné konfiguráky, tak má asi i tuhle blbou vlastnost, že?
P.S. to povídání na začátku článku oceňuju, fakt hezky napsaný a dost ze života :)
Ovšem pointa téhle pohádky je jinde..
celé vláknoŽe tak jak tak se nikdo při větším výpadku neposere a je nakonec rád, že mu to vůbec běží. Inu.. Co by taky chtěl. Za málo peněz, málo muziky.
a co si o nagiosu mysli lidi z openbsd?
celé vláknoRe: a co si o nagiosu mysli lidi z openbsd?
celé vláknoTohle:
http://omniti.com/video/noit-oscon-demo
vypadá oproti Nagiosu a jeho nadstavbám jak z jiného světa. Architektura dobře a 100% pochopitelně navržená, web console naprosto úžasná a dotažená do konce. Nemáte to někdo v provozu nebo aspoň otestováno? Konečně jsem asi nalezl řešení, co stojí za to se naučit a nasadit ho, a nahradit jím své in-house dočasné "bastly", co už dočasně běží hodně let...
Re: a co si o nagiosu mysli lidi z openbsd?
celé vláknoTakže OSS část neobsahuje "alerts and notifications", což je škoda. Ta část ohledně sběru dat je výborná. Alerty jsou součástí hostované služby http://circonus.com
Nadstavby
celé vláknoProvozovat nagios / icinga podle me nema smysl.
Zkuste Opsview, ktere bezi nad nagiosem
Re: Nadstavby
celé vláknoNemá smysl? To bude asi věc názoru, já Nagios používám tak deset let a zatím jsem s ním maximálně spokojený...
co ine riesenia?
celé vláknoChcel by som sa spytat na podobne riesenia. Pri prvom clanku serie by som to ocakaval.
PS: poznam zabbix a vyhovuje mi, ak nepozeram na jeho j......u architekturu. Zabbix pouzivam na monitoring cca 12 strojov, ale poznam firmu, kde monitoruju cca 100 strojov a pouzivaju nejaky distribuovany konfig, co by mohlo byt zaujimave.
PPS: Pekna otazka je, co robite, ked vam skape monitoring? (riesenie dvoch strojov s monitoringom, ktore sa navzajom monitoruju nemusi stacit. poznam z vlastnej skusenosti :)
nagios?
celé vláknoDost dobre nechapu, proc tady lidi tak silene tlaci nagios, kdyz zdaleka nedela vse, co clovek potrebuje. Napriklad neumi sbirat a uchovavat vykonnostni metriky. Takze az vam nekdy spadne vase kriticka aplikace, tak se nedozvite, ze to bylo pameti. Az zacne nejaky almost-RT system hlasit timeouty ze strany databaze, tak neuvidite zvyseni odezev na poli, nedohledate snadno vinika podle ostatnich grafu... nemate zadnou poradnou retrospekci a vhled do systemu pred X hodinami.
Ach jo.
Re: nagios?
celé vláknoRadi si nechame poradit co pouzivas ty?
existuje nejake lepsi oss reseni?
dik
Re: nagios?
celé vláknopnp4nagios kresli pekne grafy z performance data pluginov
Re: nagios?
celé vláknoMůžeš to prosím víc rozvést (pokud si toto přečteš)? na nagiosu máme sledování paměti i diskového toku, teď přidáváme počty read/write requestů za sekundu. Ale rád si nechám poradit, jak to dělat lépe, protože jde o zcela klíčovou věc.
Re: nagios?
celé vláknoNo treba zacnes na vykonostni metriky pouzivat Cacti. :)
event handlery
celé vláknodocela se divim, ze tu nikdo nezminil event handlery. to je dle meho celkem killing feature nagiosu/icingy.

