Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Hlavní navigace

Debian Lenny a stavba výpočetního clusteru

Tento článek popisuje cestu, která vedla k vytvoření fungujícího clusteru za pomoci operačního systému Debian Lenny na Ústavu molekulární biologie rostlin Biologického centra Akademie věd ČR. Je zde zdůvodněn výběr tohoto řešení a každý, kdo by se chtěl o linuxový cluster sám pokusit, zde nalezne cenné rady.

Tweetni to Twitter Jaggni to! Jagg Del.icio.us Delicious

Proč cluster?

Velmi pěknou definici clusteru podává Wikipedie. Bohužel zde není uveden autor nebo původní zdroj tohoto textu. Zde bych měl asi podotknout, že v našem případě se jednalo o cluster výpočetní. Hned na začátku musím vysvětlit, proč jsme se pouštěli do stavby clusteru. Dnes častý argument proti clusterům je, že je levnější (a hlavně jednodušší) nakoupit jeden výkonný počítač, než se pouštět do stavby clusteru z několika slabších počítačů. To bohužel nebylo v našem případě možné, protože jsme státní organizace a nebylo možné koupit počítač přes 40 000 Kč (aby to nebyl základní prostředek). Naopak jsme mohli nakoupit několik počítačů v ceně pod 40 000 Kč. Za tuto cenu jsme pořídili 4 počítače se čtyř-jádrovými procesory Intel Xeon a 16 GB RAM a dále jsme již měli k dispozici jeden počítač o něco slabší a jeden o něco silnější (ten se stal Masterem). Tedy ideální situace pro sestrojení clusteru.

Důležité pojmy a topologie clusteru

Nyní se seznámíme s některými dále použitými pojmy z topologie clusterů:

Master
Řídící počítač clusteru. Na něm běží různé služby, jako např. NFS, LDAP, DHCP, DNS a dále serverové části programů pro paralelizaci výpočtů. Obvykle se neúčastní samotných výpočtů, pouze úlohu rozděluje pro jednotlivé uzly.
Nod
Jednotlivé výpočetní uzly clusteru.

Než začnete s realizací clusteru, měli byste se rozhodnout pro jednu z dvou topologií (Obrázky 1 a 2).

Výhodou první topologie je vyšší propustnost a tím i rychlejší výpočty. Nevýhodou je obtížný (anebo nemožný) přístup zvenčí přímo k jednotlivým nodům. U druhé topologie je tomu naopak.

Ještě bych zde měl uvést, že dvě základní metody paralelizace výpočtů jsou PVM a MPI.

Topologie

Naše první pokusy

Na počátku jsme řešili výběr vhodné technologie pro sestrojení clusteru. Zjistili jsme, že existují dva otevřené projekty, a to openMosix a Beowulf, a jedno komplexní řešení Rocks Clusters, založené na distribuci CentOS. Popis sestavení clusteru Beowulf mi přišel poměrně složitý (pravděpodobně se mnou nebudou někteří souhlasit), a proto jsme se rozhodli pro řešení openMosix na Gentoo. Bohužel když jsme chtěli k realizaci přistoupit, objevila se na jeho www stránkách zpráva o ukončení tohoto projektu.

Proto jsme nakonec přistoupili k realizaci clusteru pomocí distribuce Rocks Clusters ve verzi 4.3. Tento cluster jsme také úspěšně sestavili, přičemž jsem použili topologii z obrázku 1. Bohužel tento cluster nesplňoval všechny naše požadavky (například nefungovala technologie PVM a byly problémy i s mpi). Rovněž jsme zjistili, že dokumentace ze serveru Rocks Clusters je hodně nepřesná a zavádějící (obsahuje zřetelně i takové informace a nastavení z původních verzí, které již neplatí). Proto jsme po zveřejnění verze 5.0 přistoupili k přeinstalování clusteru. Bohužel u Rocks Clusteru není možný upgrade a při přechodu na novější verzi je nutné cluster přeinstalovat. Verze 5.0 však pro nás byla zklamáním. Nejen, že nebyly opraveny chyby, ale navíc po nějaké době přestal být z jednotlivých uzlů „vidět internet“, což byl problém např. při doinstalovávání modulů do Perlu. Dali jsme této distribuci ještě jednu šanci a hned po vydání verze 5.1 jsme přistoupili k její instalaci. Tuto verzi však považuji za naprostý propadák. Obsahuje fatální chyby v instalačních skriptech a není možné ji nainstalovat bez úpravy těchto instalačních skriptů. Obsahuje také všechny již popsané chyby, včetně zmatečné dokumentace. Při hledání v diskuzních skupinách jsme navíc narazili na skutečnost, že stejné problémy popisují i jiní uživatelé.

Za této situace jsme se již rozhodovali o ukončení pokusů o linuxový cluster, když jsme objevili informaci, že na Filipínách byl sestrojen cluster pro předpověď počasí s operačním systémem Debian Linux. Po krátkém hledání jsme objevili stránky Debian Clusters a rozhodli se pro sestrojení obdobného clusteru. Sestavení tohoto clusteru popíši v dalším textu.

Projekt Debian Clusters a jeho instalace

První, co asi upoutá návštěvníka stránek projektu Debian Clusters for Education and Research: The Missing Manual, je stáří stránek. Poslední změna zde proběhla před více než rokem. Předpokládám, že je to dáno tím, že autoři těchto webových stránek je vytvářeli tak, jak jejich projekt vznikal a po jeho dokončení je přestali vyvíjet. Předpokládám, že se k nim vrátí při tvorbě dalšího clusteru, neboť některé věci jsou již zastaralé. Přesto není třeba se obávat, cluster lze dle tohoto postupu jednoduše vytvořit, avšak je nutné počítat s možností, že bude nutné vyhledat nějaký problém v diskuzních skupinách, zejména pokud použijete novější verze programů. Já sám jsem se k tomuto kroku musel několikrát uchýlit, ale myslím, že na vině mohla být i moje neznalost některých základních postupů a řešení.

Problémem tohoto řešení je nutnost kompilace některých programů a úprava linuxového jádra. Z toho vyplývá i pozdější obtížná aktualizace systému. Pokud totiž zaktualizujete některé knihovny, na kterých jsou závislé přeložené programy, můžete způsobit nefunkčnost těchto programů.

Ve všech případech, kdy bylo nutné nějaký program přeložit, jsem se snažil stáhnout z domovských stránek tohoto programu co nejnovější verzi a tu pak použít. Pouze jádro, na které je nutné aplikovat patch perfctr, jsem musel použít 2.6.26, novější mi nešlo přeložit. Testoval jsem to na jádrech 2.6.27 a 2.6.30-rc (přesné verze si již nepamatuji).

Ostatní postupy fungovaly velmi dobře, pouze LDAP jsem instaloval podle jiného návodu, neboť zde uvedený postup zřetelně popisuje nějakou starší verzi. DHCP a DNS jsem nepotřeboval, tudíž tuto část návodu nemohu posoudit. Klonování nodů podle zveřejněného návodu mi také nefungovalo, zřejmě jsem dělal nějakou chybu, proto jsem použil kopírování pomocí image disku.

Současná topologie našeho clusteru je zobrazena na následujícím obrázku. Master má dvě síťové karty, na jedné je připojen do sítě a na druhé je připojeno diskové pole.

Finální řešení

Závěr

Přes uvedené výtky a zkušenosti mohu tvorbu clusteru pomocí tohoto postupu doporučit. Připravte se na to, že pokud budete chtít použít novější verze použitých programů, budete si možná muset najít řešení některých problémů na Internetu, ale neměl by to být problém. Máte-li možnost opatřit si větší množství slabších počítačů, tak toto je cesta, jak z nich vytvořit výkonnou výpočetní jednotku.

V příští části si povíme něco o zkušenostech z nasazení a programech, které využíváme.

Školení Google+ pro firmy

DW - Školení PPC
  • Jak využít Google+ pro firemní komunikaci a marketing.
  • Čím se liší Google+ od Twitteru a Facebooku z pohledu firemního využití.
  • Jak využít Google+ v souladu s pravidly užívání.
  • Založení Google+ Page (Stránky) krok po kroku, včetně praktických tipů.

Detailní informace o školení Google+ »

Ohodnoťte jako ve škole:
Průměrná známka 2,79

Přehled názorů

je to takove o nicem ;(
petr 7. 9. 2009 00:24
Nový
└ 
Re: je to takove o nicem ;(
mcmiazga 7. 9. 2009 01:16
Nový
Cele je to nejake pomatenem, ale co Torque?
Simon Toth 7. 9. 2009 00:43
Nový
grid
jimik 7. 9. 2009 07:27
Nový
Je treba znovu nalezt kolo
Jarda 7. 9. 2009 08:00
Nový
└ 
Re: Je treba znovu nalezt kolo
Jiří Pech 7. 9. 2009 08:21
Nový
 
├ 
Re: Je treba znovu nalezt kolo
k 7. 9. 2009 08:37
Nový
 
│
└ 
Re: Je treba znovu nalezt kolo
dustin 7. 9. 2009 12:04
Nový
 
└ 
Re: Je treba znovu nalezt kolo
HonzaH 7. 9. 2009 13:32
Nový
 
 
└ 
Re: Je treba znovu nalezt kolo
Jirka 7. 9. 2009 14:16
Nový
 
 
 
└ 
Re: Je treba znovu nalezt kolo
k 10. 9. 2009 22:13
Nový
stavba clusteru je sranda
afas 7. 9. 2009 08:40
Nový
└ 
Re: stavba clusteru je sranda
Jirka 8. 9. 2009 02:30
Nový
 
└ 
Re: stavba clusteru je sranda
wqerqwr 8. 9. 2009 06:24
Nový
dnes uz radeji GPU
adsasd 7. 9. 2009 09:01
Nový
└ 
Re: dnes uz radeji GPU
OgL 8. 9. 2009 19:35
Nový
 
└ 
Re: dnes uz radeji GPU
dan 11. 9. 2009 10:34
Nový
To jsem po dlouhe dobe ucitil zavan historie
MilanK 7. 9. 2009 09:16
Nový
└ 
Re: To jsem po dlouhe dobe ucitil zavan historie
Jiří Pech 7. 9. 2009 14:43
Nový
 
└ 
Re: To jsem po dlouhe dobe ucitil zavan historie
lobo 8. 9. 2009 23:47
Nový
je to o schopnostech admina
František Ryšánek 7. 9. 2009 09:36
Nový
├ 
Re: je to o schopnostech admina
Tomáš Crhonek 7. 9. 2009 14:30
Nový
│
└ 
Re: je to o schopnostech admina
František Ryšánek 7. 9. 2009 15:51
Nový
└ 
Re: je to o schopnostech admina
e. 8. 9. 2009 12:36
Nový
Nod?
Radek 7. 9. 2009 12:24
Nový
InfernoOS
Harvie .cz 7. 9. 2009 20:41
Nový
└ 
Re: InfernoOS
Petr Klíma 11. 9. 2009 07:40
Nový
Tygr
L. 7. 9. 2009 20:46
Nový
├ 
Re: Tygr
Miroslav Prýmek 7. 9. 2009 20:56
Nový
└ 
Re: Tygr
m. 8. 9. 2009 08:16
Nový
IKEA cluster
faha 8. 9. 2009 07:13
Nový
Access server
Kocour Mikeš 8. 9. 2009 16:00
Nový
└ 
Re: Access server
František Ryšánek 13. 9. 2009 22:48
Nový
A co PS3?
Aminux 8. 9. 2009 18:08
Nový
└ 
Re: A co PS3?
dfsadf 9. 9. 2009 09:28
Nový
opensolaris + cluster express
nettezzaumana 15. 9. 2009 01:03
Nový
Opravdové clustery
Kocour 19. 9. 2009 21:37
Nový
└ 
Re: Opravdové clustery
MeDon 11. 10. 2009 17:13
Nový
Hrani
NadsenecDoPc 2. 11. 2009 18:55
Nový
       

Tento text je již více než dva měsíce starý. Chcete-li na něj reagovat v diskusi, pravděpodobně vám již nikdo neodpoví. Pro řešení aktuálních problémů doporučujeme využít naše diskusní fórum.

Zasílat nově přidané příspěvky e-mailem