Hlavní navigace

IBM představila procesor Power 7

Sdílet

Petr Krčmář 10. 2. 2010

Společnost IBM představila novou řadu procesorů PowerPC, označenou jako Power 7. Procesor je vyroben 45nm technologií a obsahuje osm samostatných jader. Každé z nich navíc dokáže provádět až čtyři vlákna zároveň a to při frekvencích 3 – 4,14 GHz nabízí teoretický výkon až 265 GFLOPS na jeden procesor. Ars Technica jej porovnává s procesorem Niagara 3 od Sun Microsystems.

Našli jste v článku chybu?
  • Aktualita je stará, nové názory již nelze přidávat.
  • 10. 2. 2010 12:50

    Lenin POWER!

    http://www-01.ibm.com/software/lotus/passportadvantage/pvu_licensing_for_customers.html

    Jinak zakaznici se na nej dost tesili a P6 je prakticky posledni kvartal jiz neprodavali vubec. To ze bude v polovine tohoto roku a jeho parametry se vedelo dost dopredu. My dva Power 750 Express uz mame.

    Jinak je lepsi linknout announcement od IBM:
    http://www-03.ibm.com/press/us/en/pressrelease/29315.wss

    zejmena doporucuji prostudovat sekci „Innovative, Workload-Optimized Features“

    s durazem na:

    TurboCore mode, which is highly optimized for database or other transaction-oriented workloads, does this by running with four cores active and putting most of the resources from all eight cores.

    new POWER7 technology, Active Memory Expansion™, a unique capability that uses memory compression technology to make the physical memory on the system appear to the application as if it were up to twice as large as it actually is.

    S pozdravem LENIN POWER

  • 10. 2. 2010 16:48

    rda (neregistrovaný) ---.adsl.green.ch

    Ty v tom asi dost jedes.. jake maji TCO tydle potvory v porovnani treba se stejne vykonnym PC-based clustrem? (uvazujme feature-wise ± stejny cluster, tj. dostatecnou redundanci sw/hw)

  • 10. 2. 2010 17:48

    Ivan (neregistrovaný) 165.72.200.---

    Tady jde hlavne o to, ze to neni cluster ale jeden server. Nektere ulohy se proste nedaji paralelizovat.

  • 10. 2. 2010 19:12

    rda (neregistrovaný) ---.adsl.green.ch

    Ma to 8 jader po 4 vlaknech = 32 paralelnich uloh. Cokoliv na tom pustite musi byt paralelni uz z principu, jinak by se to flakalo.. takze je to temer obycejne PC s vicejadrovym CPU. Z hrubeho porovnani vykonu ma tento 1-cpu/8-core/32-thread system zhodny vykon jako 4-cpu/16-core/32-thread system (4× quad core xeon 4×70 GFlop). Takze jde jen o vyssi integraci.. zrat to bude stejne nebo trocha mene nez ten 4-cpu x86–64.

  • 10. 2. 2010 20:42

    miklik

    No jo, ale když se tam dají 4 x P7, tak to bude někde jinde. Ještě samozřejmě záleží na technologii paralelismu a na aplikaci.

  • 10. 2. 2010 21:49

    Lenin POWER!

    Kdyz srovname POWER6 s pre Nehalem Intely, tak POWER6 5.1Ghz je asi 4× rychlejsi per core ve spec int/fp. Zrat to bude o dost mene ve srovnani s Intelem, POWER7 zere polovinu toho co POWER6 per core.

    POWER7 se bude moct davat do blade serveru s plnou rychlosti, on to je vlastne specialne vytvoreny procesor pro FP vypocty na bladech s velkym mnozstvim pameti a procesoru. POWER6 blady jsou taktovany na min nez 5 GHZ kvuli chlazeni.

    p7 ma 4 double-precision floating-point units a 1 vector unit per core. Taky se musi vzit v uvahu ze ted umi zpracovavat az 5 instrukci/takt per core, POWER6 umelo 4, z10 umi 6.

    Na clustery pro vypocty bude dobrej a tam se dava velka sleva oproti katalogove cene, asi tak 50% u HW a u SW az 80%. To zalezi na tom kdo vam to bude prodavat a jak umite vyjednavat. Za 30% z usetrenych penez – platba predem – vam muzeme dohodnout lepsi cenu u IBM Canada.

    oproti intelum ma POWER6 vyrazne lepsi spolehlivost a ono je to u tech vypoctu potreba aby tam nepreskakovali bity kdyz se to vic zahreje, automatic instruction retry je fajn vec a prezije full dimm failure. POWER6 ma 300Gbps pristup do L3 cache.

    Pokud jde o p7 rychlosti standard jsou 3,0 – 3.55 a na 3,86 – 4,14 Ghz jsou potreba lepsi desky. Ty co umu turbo core mode ty maji 2× L3 oproti normalnim a pri turbo mode se mu zvedne frekvence. P7 je oproti P6 s vyssi frekvenci asi o 20–30% rychlejsi per core, ve FP je tak o 50% rychlejsi nez P6. Skalovatelnost P7 – max 32 procesoru 360 GB/s procesor to procesor data transfer, 100 GB/s pristup do DDR3 pameti. Ty 4 thready per core se daji vypnout a nechat si tam 1 nebo 2.

    taky tohle je hezka prezentace p7
    http://www.ibm.com/developerworks/wikis/download/attachments/104533501/POWER7%2B-%2BThe%2BBeat%2BGoes%2BOn.pdf

  • 10. 2. 2010 23:43

    rda (neregistrovaný) ---.adsl.green.ch

    Dik za to porovnani a prezentaci – vypada to zajimave a promyslene :) neda se sehnat nejaky workstation s tim procesorem? resp. co stoji (budou stat) ty nejlevnejsi servery?

  • 11. 2. 2010 13:18

    Lenin POWER!

    workstations s P6 byly, takze s P7 budou urcite taky. V pripade ze by nebyly vyrabene seriove, tak vam je sestavi na zakazku. To se bezne dela, a neplati se za to nic navic protoze ty System p se stejne montuji rucne takze je to jedno. Clovek se pak divy v jakych konfiguracich potkava POWER servery.

    Ten 750 Express co tu mame ma list price cca $32k coz je dobry za 4 socketovej server s P7, v cene je CPU licence pro 8 jader/3Ghz. Je to teda s AIXem, ty s Linuxem jsou drazsi o SLES licenci, REDHAT bych na to nedaval ty delaji POWER jen okrajove. AIX je zadara u nej se plati jen za support.

    Ta cena pujde asi po pul-3/4 roku dolu jako obvykle, ale u tohodle entry modelu asi moc ne, jestli vubec. Ty entry modely maji jako vzdy dost dobry pomer vykon/cena + je na ne casto levnejsi i5/os soft. pro zajimavost ta sama masina jen s 3.3GHZ CPU/8 core stoji o $20k vic, socky si tedy koupi tu pomalejsi a preswtichnou si rychlost na desce az jim HMC bootne a prekontroluje licence.

    Pokud se jedna ale o sockety tak tam narozdil od exponencialniho narustu ceny per GHZ (zase je na to levnejsi soft protoze ten se plati per core) plati ze cim vice socketu tim je to levnejsi per core – napriklad 32 core je oproti 4 core asi o 30% levnejsi per core – takze se rozhodne vyplati si kupovat velky masiny (minimalne 32 cores/server). Skalovatelnost maji dobrou a od P5 uz to ani nema baremetal mode, takze virtualizace to vubec nebrzdi – podobne jako na mainframech.

    Vetsinou tedy lidi preferuji 1 server per aplikace a pak tedy plati vic, oni ty lepsi POWER servery jsou uz skoro jak mainframe – taky se tam daji komponenty menit za chodu vcetne pridavani/odebirani pameti – jen pokud tam je linux tak se musi pak ty linuxovy LPAR restartovat, kdyz se jim prida/odebere pamet, coz je dost opruz zejmena pokud v tom bezi databaze. AIX ten umi i menit kernely bez rebootu.

    POWER7 blades ale v nabidce jeste nevidim, ale 4 core P6 4GHZ blades jsou dost levny $4.5k. Pokud ta vase aplikace se umi dobre skalovat na vice pocitacu, tak jsou blades nejlevnejsi reseni, pokud ji spis sedne multithread rezim (protoze by musela moc komunikovat mezi nodama) tak je lepsi IBM Power 755 server, ten je pro tyhle HPC aplikace.

    Tady je kratky prehled serveru
    ftp://ftp.software.ibm.com/common/ssi/pm/br/n/pob03022usen/POB03022USEN.PDF

    Ja mam osobne rad blades a uplne bych nima nahradil vsechny 1 nebo 2 RU servery, u 4RU bych to jeste zvazil. Setri to misto, elektriku, kabelaz, a usnadnuje to spravu. Je to spis o psychologii, lidi by radi videli za svy penize neco velkeho – ne mini blade.

    My treba mame 2500 serveru na kterych delame ISP dedicated server hosting a migrujeme zakaznicke servery na blades – protoze uz nam doslo misto a elektrika a sve managed servery ty migrujeme na 32 core Power 570, da se na to premigrovat cca 1,5 racku 2 RU serveru.

  • 16. 2. 2010 10:42

    Blbeček (neregistrovaný) ---.net.upc.cz

    Asi nejsem takový odborník jako vy, ale na stránkách spec vidím výsledky trochu jiné. Přiznám se, že v tom mají buď zmatek, nebo se v tom nevyznám, ale já tam vidím něco trochu jiného. Někeré jejich výsledky se pro servery s různým počtem jader vůbec neliší a já předpokládám, že je tam povoleno jen jedno jádro. Když si ale vyhledám výsledky Xeonu a Power6, tak Intel dost jasně vede. Xeon X5570, 2.93 GHz s osmi povolenými jádry má vs SpecInt2006 225 až 240 bůdů a v SpecFp2006 kolem 190. A Power6 na 4.7 GHz má zhruba 210 a 190 (int, fp). A to pochopitelně Power6 běží na výrazně vyšší frekvenci, má mnohem více transistorů a je mnohem dražší. Možná sem blbej, třeba tomu nerozumím, ale tyhle výsledky tam vidím. Co si pamatuji, tak i v různých odborných článcích se člověk může sem tam dočíst, že Power6 oproti Inteláckým Xeonům nemá šanci. Co jsem ale viděl nějaké výsledky Power7, tak tam už IBM vedlo na stejné frekvenci na jedno jádro asi o 40% (už si to přesně nepamatuji), nicméně do roka Intel se Sandy Bridge asi IBM zase předhoní. Nepředpokládám totiž, že IBM budeuvádět v nejbližších letech neco výkonnějšího.
    Jestli jsem tam ty jejich výsledky nepochopil, tak se omlouvám :-), ale fak je to tam trochu zmatené.

  • 17. 2. 2010 21:04

    Lenin POWER!

    No ja tam vidim:

    Intel Xeon X5570 – 8 cores – 32.0 36.0
    IBM System p 570 (POWER6) (4.7 GHz, 1 core) 17.8 21.6

    http://www.spec.org/cpu2006/results/cint2006.html

    Ted nemam cas to hledat, ale mam i tu tabulky ruznych benchmarku pro jednotlive POWER6 a POWER7 masiny.

  • 18. 2. 2010 7:40

    Blbeček (neregistrovaný) ---.net.upc.cz

    A není trochu divné, že na té stránce cos tu odkazoval má Xeon X5570 naprosto stejné výsledky když má povoleno 8, nebp 4 jádra? ( http://www.spec.org/cpu2006/results/res2009q2/cpu2006-20090316-06716.html a http://www.spec.org/cpu2006/results/res2009q2/cpu2006-20090316-06711.html ). To je právě to o čem jsem mluvil. Podle mě tam maj chyby. Ačkoli tam píšou u toho Xeonu, že je tam povoleno 8 jader, běží to jen na jednom. Já sem procházel spoustu tamních výsledků a sedí to. V jiných testech kde mají Xeony mnohem vyšší vísledky (několik stovek bodů) to vychází v průměru na přes těch 30 bodů na jádro. Nechal jsem si také vypsat výsledky hledání a třeba tady ( http://www.spec.org/cpu2006/results/res2009q2/cpu2006-20090424-07153.html ) má tentýž Xeon 250 bodů při povolených 8mi jádrech, což dává cca těch 30 na jádro.
    Teď se mi to už nechce hledat, ale testy Linpack ukazují něco poobného. Žádné drcení Xeonu od Power architektury se tam nekoná.

  • 18. 2. 2010 23:50

    Lenin POWER!

    Takze jsem se mrknul pro vysledku od IBM a tam je:

    POWER6 – 1 core – 1 thread
    1-core IBM Power 570 (4.7 GHz) ranked #1 1-core Linux result in the industry (21.7 SPECint2006 result, 1 core, 1 chip, 2 cores/chip, 1 thread/core, Linux).

    POWER6 – 2 core – 4 threads
    A 2-core IBM Power 570 (4.7 GHz) is the best 2-core system (60.9 SPECint_ra­te2006 result, 2 cores, 1 chip, 2 cores/chip, 2 threads/core).

    pro 8 core aby se to dalo primo porovnat s tim xeonem tam ale zadny vysledek nemaji, zajimave jsou tyhle:

    # A 64-core IBM Power 595 (5 GHz) is the best 64-core Linux system (2,160 SPECin­t_rate2006 result, 64 cores, 32 chips, 2 cores/chip, 2 threads/core, Linux). – tedy 33.75 per core

    POWER7
    # A 64-core IBM Power 780 (MaxCore, 3.86 GHz) is the best 64-core system (2,530 SPECin­t_rate2006 result, 64 cores, 8 chips, 8 cores/chip, 4 threads/core).
    39.5 per core

    Ten Xeon ma 29,8 per core specint_rate. Takze vsechny POWER6 ci 7 jsou rychlejsi nez ten X5570, pravda P6 4.7Ghz jen nepatrne.

  • 19. 2. 2010 13:03

    Blbeček (neregistrovaný) ---.net.upc.cz

    Zvláštní, že Power 6 má při povoleném jednom jádře výkon cca 22, ale pokud se zprůměruje 64 jader, má skoro 34. Člověk by čekal, že výkon na jádro bude díky režii spíše klesat. Že by nárůst výkonu přes 50% dělal hyperthreading? Jestli ano, tak IBM gratuluji. Divné, že u Intelu takové rozdíly nejsou, ačkoli v dobře multithreadových aplikacích hyperthreading u Intel CPU běžně těch 30% nahoru dává.

    Jen tak mimochodem, dobře se dají tyto platformy benchmarkovat i podle stránek TOP500. Tam jsou výsledky z Linpacku a pokud si to člověk zprůměruje, vychází také zajímavé výsledky. Je třeba si dát pozor, že tam není uveden počet CPU, ale rovnou počet jader:
    -Power 6 4.7GHz má asi 14 až 14.7 GFLOPs na jádro (u jednotlivých superpočítačů se to lehce liší)
    -Xeon 5570 2,93GHz má cca 10,3 GFLOPs na jádro.
    -Itanium 2 1.6GHz 5.3 GFLOPs na jádro.
    Zde tedy Power 6 vede, ale při přepočtu na frekvenci je trochu pomalejší než Xeony. Itanium 2 je při přepočtu na frekvenci zhruba na jejich úrovni. Pokud se ale člověk podívá na výkon na CPU, je jasně nejlepší Xeon. Power 6 s pouhými dvěmi jádry (ani Itanium 2) na Xeony prostě nemaj.

  • 10. 2. 2010 21:55

    Lenin POWER!

    z tech 8 jader po 4 vlaknech se da udelat Turbo modem 4 jadra po 1/2 vlakne s vyssi frekvenci a vyrazne vetsi L3 Cache per core