operační systém je jen podloží a nad ním poté běží nějaké aplikace, které si sami řeší komunikaci po síti a distribuci výpočtů.
Neviděl bych technicky problém v provozu Windowsu, je ale otázka co to přinese a hlavně cena za licence bude opravdu astronomická, platí se za core a klidně může může dosahovat 15 % (cucáno z prstu) ceny clusteru což je dost.
Ta licence by byla uplne minimum .... bezela by tam jen verze core bez GUI (taky k cemu GUI) v nejake multilicenci, povetsinou bud akademicke nebo statni, takze cena by byla skutecne zanedbatelna (troufnu si tvrdit v radu desetitisicu korun). NT jadro je spickova zalezitost, tu nedelaji lofasove z managementu. Sveho casu to bylo (nejspis jeste je), nejmodularnejsi a nejpropracovanejsi jadro vubec s funkcema jako vsemozne migrovani atd. V desktopovych windows se z toho pouzije na domacim pocitaci mozna tak 5%. Ale to je fuck, nehodlam zakladat flame. Jista vec ale je, ze je tam proste linux, ani ne tak proto, ze by byl nejlepsi (to jiste neni), ale protoze je open source a da se z jadra vyhazet prakticky uplne cokoliv aniz by clovek musel prosit vyrobce. Jak myslite, ze to jadro linuxu na takovem superpocitaci velke? Co tam zbylo? Nema to disky, nema to zadne periferie, ma to jen CPU, pamet a sitovku. V jadre zbyl mozna nejaky jednoduchy scheduler a ovladac sitovky .... veskere rizeni vlaken a komunikaci s okolim zajistuje nejaka minimalisticka obsluzna "cloudova" aplikace, ktera dokaze prijmout Ceckovy kod a ten zacit vykonavat. V podstate nic dalsiho se od takoveho nodu ani neceka. Neni treba vubec resit nejake zabezpeceni atd .... taky proc? Myslite, ze tam pobezi web server, ftp, ssh, nejake desktopove prostredi a tak?:o)))
Tak to si dovolim oponovat. Caching filesystemu ma Windows kernel jednoznacne horsi. Stejne tak pomalejsi alokator pameti, pomaleji start novych procesu, poskytuje svoje sluzby s vetsi latenci, nez Linux a prostredky vyuziva zdaleka ne vzdy optimalne.
Naopak lidi, co pisou core subsystemy linuxu maji HPC z nejakeho duvodu velmi blizko svym preferencim pri designovani (viz. SLUB, moznost prepinat IO planovace, tunables scheduleru, page cache...).
Ja z toho pak na "businessovejsich" aplikacich brecim, protoze mam priority uplne jinde, nez aby se co nejrychleji pocital jeden konkretni task - resim opravdovy time sharing najednou na jednom jadru a podobne, od ceho prave byly puvodni Unixy a vcem jsou dobre.
Treba OpenIndiana jako fileserver pres NFS naprosto neprekonatelna vec, kontejnery, ZFS, atd. - na linuxu by jeden zabrecel.
Ale pak potesi videt, proc to tak je... 99.6%!!! Smekam vyvojarum Linuxu, to je solidni knock-out konkurence.
Ale vždyť nevíte o čem mluvíte. Například "superpočítač" SETI@home má výkon cca 681 teraFLOPS (údaje z roku 2014), a 1.6 milionu uživatelů. Každý z těch uživatelů má minimálně jeden CPU, a dohromady mají spoustu paměti. Superpočítače z TOP500 fungují velmi podobně: spousta nodů nacpaných do racků, a SW který distribuuje úlohy na jednotlivé nody. Rozdíl oproti SETI@home je primárně v tom, že ty nody bývají fyzicky blíž a umí spolu rychleji komunikovat.
Myslet si, že řekněme Tianhe-2 s 3M jader a 1TB RAM je prostě jedno velké PC na kterém běží Kylin Linux, je opravdu veliká naivita.
Pokud jde o licence, tak to je problém. Tianhe-2 používá 12-jádrové Xeony. Pokud počítáme 24 jader na node, tak je těch nodů 125000. To znamená 125000 licencí OS, a v případě desktopových Windows cca 3M USD na licencích. Přitom od OS na nodu superpočítače potřebujete jen aby zabootovat, nastartoval nějaký proces který umí stáhnout z management nodu dávku dat ke zpracování, a pak uploadnul výsledek. To umí každý Linux a každé FreeBSD, úplně zdarma. Za ty ušetřené miliony USD koupíte HW, nebo z nich na nějaký čas zaplatíte tu skupinu lidí v bílých pláštích, kteří střídavě pobíhají po serverově a popíjejí kafe v místnostech okolo.
http://images.en.yibada.com/data/images/full/72030/tianhe-2-has-maintained-its-rank-as-the-worlds-most-powerful-supercomputer-for-the-sixth-consecutive-time.jpg
Poslední verzí byl Windows HPC Server 2008. Od Windows 2012 neexistuje HPC edice, a místo toho můžete použít Microsoft HPC Pack, který se instaluje na Windows Server 2008 R2 - 2012 R2. Samozřejmě musíte zaplatit licenci těch serverových Windows.
Windows HPC i HPC Pack míří někam trochu jinam než do TOP500. Přebrat trh OS pro superpočítače je dost problém, když je odjakživa Unixový a dneska Linuxový, veškeré zdrojáky jsou unixové, zákazníci i dodavatelé pracují s Unixy/Linuxem, a používají se OS zdarma. Jak na tom chcete vydělat? Leda tak že vyděláte na něčem jiném.
"Klasický" superpočítač je jeden velký experiment, kde týdny skládáte HW, pak měsíce ladíte, a nakonec máte trvale velkou partu lidí, kteří váš superpočítač provozují. Na to máte buď studenty, které můžete poslat na "nucené práce", nebo veliké (a drahé) IT oddělení. WinHPC (Pack) je naproti tomu určený pro zákazníky typu pojišťoven, bank apod., které potřebují vysoký výkon třeba na aplikace typu stochastického modelování, a nechtějí jít do takových experimentů. Dodavatel přiveze racky a osadí je, a za chvíli máte plně funkční superpočítač včetně správy. Ten má podporu Visual Studia včetně vzdáleného debuggování, připravené Services for Excel (ve světě financí univerzální nástroj), můžete mít podporu SPSS Statistics, R a řady dalších aplikací. Nic s čím by si neporadilo schopnější IT oddělení, není potřeba žádná parta v bílých pláštích. A když potřebujete víc výkonu, můžete si ho celkem jednoduše koupit v MS Azure cloudu (tohle prý má mít značný potenciál - uvidíme). Do TOP500 se takhle ale dostanete těžko, protože jde o úplně jiný trh.
"...To umí každý Linux a každé FreeBSD, úplně zdarma..." Náklady na operační systém u takových superpočítačů nejsou zrovna zanedbatelnou položkou. Můžete to risknout a dát OS bez suportu. Ale obvykle je levnější si support (licenci) zaplatit, než půl roku řešit interními silami nějaký problém. Zjistěte si, kolik stojí licence SLES, a pak pochopíte, jak směšně zní slovní spojení "linux zdarma".
Koukám na wiki na TOP500. Jsou to data z června, ale to je celkem jedno. První dva stroje jsou čínské a běží na vlastních odrůdách Linuxu. Nejspíš jde o kooperaci mezi státními orgány, univerzitami a polostátními dodavateli, a dost pochybuji, že by platili za OS někomu jinému než sami sobě.
Na třetím místě je Titan, který běží v Oak Ridge National Laboratory. Dodavatelem je Cray, a OS je Cray Linux Environment. Cena licence Linuxu pro výrobce Cray: 0. Alternativně cena za licenci Windows 10 OEM pro 16868 nodů, po 68 USD: 1.3M USD.
Na čtvrtém místě je IBM Sequoia. Na 98304 nodech běží Compute Node Kernel, což je minimalistický kernel o pár tisících řádků, bez multitaskingu a virtuální paměti, a dokonce bez file I/O. Na čtyřech login nodech běží RHEL. Podle dalších zdrojů by tam mělo být 768 nodů na I/O Node Kernel, které se starají o file I/O pro ty nody běžící na CNK. Cena Linuxu pro IBM: čtyřikrát pár set dolarů ročně. Alternativně cena za licenci Windows 10 OEM na 98000 nodů, po 68 USD: 6.7M USD. Odhlédněme pro začátek od toho, že jde o SPARC64 :)
https://computing.llnl.gov/?set=resources&page=SCF_resources#sequoia
K tomu je tam 768 nodů údajně na RHEL, ty se starají o I/O. Jenže jde o Blue Gene/Q, který by měl pro I/O nody používat INK, který je postavený na modifikovaném Linuxu. Takže Red Hatu platí buď nula, nebo dost málo.
Jako další vidím K computer, který běží custom OS založený na Linuxu. Cena za licenci Linuxu pro výrobce Fujitsu: 0.
Pak je tu IBM Mira, což je opět IBM Blue Gene/Q, jako Sequoia. Opět jsou tam 4 login nody na RHEL, pár I/O nodů běžících I/O Node Kernel, a hromada nodů běžících Compute Node Kernel.
http://www.alcf.anl.gov/user-guides/machine-overview
Když to shrnu, tak v uvedených případech nikdo neplatí licence na nody.
tak kdyz uz jsi v tech vypoctech, zamer se na statni spravu v Ceske republice, jen napovim:
za Microsoft Windows + Microsoft Office se v CR plati za 1rok jenom za licence 1.5miliardy Kc
za GNU/Linux + LibreOffice by se na licencich zaplatilo 0Kc
takze logicky zaver, Ceska republika by mela urychlit ten prechod na opensource, GNU/Linux, LibreOffice...
LLNL, ktere Sequoiu provozuje, jede na Scientific Linuxu, ktery delaji CERN a Fermilab, tam nejake vazby na Red Hat jsou, ale netusim, kolik protece penez. Moc asi ne, kde by je vzali :) Jinak LLNL plati treba Briana Behlendorfa za penize z Department of Energy (nejake granty konkretne na ZFS on Linux jako backend pro Lustre filesystem). DoE plati celou tu srandu tam a je z toho spousta uzitecneho open-source na venek. Zkuste tohle s Windows ekosystemem ;)