Ten graf vznikl z výsledku měření na výkon z hlediska operací které běžně provádí GPU nebo CPU? I když jsou dnes GPU velmi rychlá připadá mi absurdní že by takto na poli CPU dominovala nvidia :), jinak se zde porovnává neporovnatelné.
Názory k článku
Úvod do technologie CUDA
Re: Že by další revoluce?
celé vláknoA ještě něco. V úvodu článku se píše že by bylo hezký využít GPU k něčemu jinému nežli k 2D a 3D. Potom nevím co takový GPU počítá u zpracování videa, filmu či offline renderingu :). U vědy a medicíny se autor raději vyhnul konkretizaci. Skoro jakoby tu byla důležitější značka grafické karty nežli podstata technologie která je tu prezentována.
Re: Že by další revoluce?
celé vláknoJako zástupce vědy si dovolím konkretizovat: ve fyzice je velmi často třeba počítat Fourierovu transformaci, pro velké soubory dat (a často také mnoho takových souborů). A pro takové úkoly je GPU jako stvořené.
Re: Že by další revoluce?
celé vláknoA samozřejmě nejen Fourierovu transformaci … libovolné výpočty vektory/poly, kdy se na jednotlivé prvky aplikuje stejná operace, jsou pro výpočty na GPU jako stvořené. To zahrnuje kromě Fourierovy transformace i lineární algebru, numerické řešení diferenciálních rovnic nebo zpracování obrazu. Ve výsledku to může dát pěknou medicínskou aplikaci na analýzu dat třeba z magnetické rezonance.
Re: Že by další revoluce?
celé vláknoJa bych jako zastupce vedy taky konkretizoval zhruba stejne. Hodne Fourierek, velke mnozstvi dat a rychle a paralelne.
Re: Že by další revoluce?
celé vláknoJá bych, co by bývalý „zástupce vědy“ (LOL! :-D), namítnul, že numerické výpočty je třeba dělat s nějakou rozumnou přesností a přesně definovanou chybou, což možnost využití GPU v této oblasti značně problematizuje.
Re: Že by další revoluce?
celé vláknoA v čem spočívá ten problém?
Re: Že by další revoluce?
celé vláknoproblem je typ float, nebo chces-li single precision
Re: Že by další revoluce?
celé vláknoNovější karty od NVidie (tuším počínaje GTX280) umí double precision.
Re: Že by další revoluce?
celé vláknoa nebo Tesla…
Re: Že by další revoluce?
celé vláknoDouble precision jednotka je na GT 200 čipech pořád jenom jedna na multiprocesor (stejně jako dělička), takže pořád nic moc. Ale jde to použít pro rychlou aproximaci a dopočítat to pak na CPU.
Re: Že by další revoluce?
celé vláknoNo grafická karta se dá využít i k akceleraci třídění dat. Viz stránky k CUDA. Tam jsou i příklady aplikací.
Re: Že by další revoluce?
celé vláknoTen graf bude nejspíš ukazovat maximální teoretický počet floating-point operací za sekundu (viz. svislá osa), tedy operací, které běžně provádějí CPU i GPU. Nevznikl asi z žádného konkrétního měření a v praxi bude dosažitelný počet FLOP samozřejmě nižší. Kdyby v tom grafu bylo i ATI, předpokládám, že by se křivka pohybovala v okolí nvidie, rozhodně nad libovolným CPU.
Jen dodatek
celé vláknoGPU je pekelne rychle ovsem data nad kterymi pracuje musi byt v pameti na graficke karte a ty presuny stoji neco casu. Pokud se nad daty nedela na GPU vice operaci, pak se vyplati to same spocitat na beznem CPU.
A do toho jeste vstupuje dulezita promena – cas programatora.
Re: Jen dodatek
celé vláknoTak, tak. Já byl poměrně zklamaný režií nutnou ke kopírování dat na grafickou kartu a po výpočtu zpět. Pro matici 50×50 se mi to nevyplatilo. Člověk musí opravdu pracovat s objemem dat nad stovky kb, ale pak to skutečně stojí za to. :) Zrychlení určitých algoritmů až 100× je reálné.
Re: Jen dodatek
celé vláknoasi proto se snazi AMD nacpat „grafiku“ primo do CPU, ze?
Re: Jen dodatek
celé vláknoJojo. Az nekdo udela pro GPU Linearni solver (GMRes) pro matice radu stovek tisic, pak koupim poradnou grafiku :)).
Re: Jen dodatek
celé vláknoChtělo by to, aby nvidia optimalizovala pro CUDA alespoň BLAS a LAPACK. Jak mám sakra ve Fortranu kopírovat data do a z paměti grafické karty? :-)
Re: Jen dodatek
celé vláknoA nejsou tyto knihovny předělané pro CUDA náhodou už dávno dostupné přímo od nVidie?
Re: Jen dodatek
celé vláknoPokud vím, tak BLAS ano (CUBLAS), ale LAPACK zatím ne a přilinkování CUBLASu do neoptimalizovaného LAPACKu není efektivní právě pro neustálé kopírování z a do paměti grafické karty. Ale sám jsem to nezkoušel.
Re: Jen dodatek
celé vláknověda, medicína, zpracování videa, film, offline rendering, apod
celé vláknoto zní jako z nejakeho priblbleho PR clanku… :(((
Re: věda, medicína, zpracování videa, film, offline rendering, apod
celé vláknoTady máte ukázku výkonu pro vcelku praktickou a přitom vysoce náročnou aplikaci při numerické předpovědi počasí. Je tam taky dobře vidět výše zmiňovaná režie za načítání dat do gr. karty a zpět.
Re: Úvod do technologie CUDA
celé vláknoAle dejte pokoj s FFT ;-) Tady je ponekud praktictejsi pouziti CUDA pro obycejne lidi ;-)
Re: Úvod do technologie CUDA
celé vláknoobycejni lide, kteri se chcou zabyvat CUDA vetsinou povazuji FFT za „obycejnou“ vec :-)
pattern matching
Ahoj, já bych zase rád viděl pomocí gpu pattern matching. To je silně parelelizovatelná záležitost a pomocí CPU je to pomalé.
Představte si třeba clamav nebo dspam pro GPU.
Zkuste běžným počítačem udělat wire speed antispam.
A nebo zone minder pro GPU. V plném palu běžný CPU zabijí jednotky kamer.
GPGPU
celé vláknomna by zaujimalo ako sa GPGPU vyvynie ak to ma existovat pre vsetky karty nie len nvidia
Re: GPGPU
celé vláknoteraz som nasiel ze opencl by malo byt univerzalne. je potom nejaky dovod pouzivat CUDA ak funguje len na jednych kartach?
Re: GPGPU
celé vláknoChystá se OpenCL, ale zatím je to v plenkách a CUDA taky víc těží z přímé vazby na HW, což u OpenCL musí řešit překladač.
CUDA Driver
Ten nazov balicku je mi povedomy. Obsahuju uz standardne balicky s ovladacom pre grafiku aj CUDA? Alebo je nejaky sposob ako zistim ci uz ten spravny driver mam?
Diky.
co dál
celé vláknoMohli by to víc otevřít. Takhle to je jen proprietární hračka na pár speciálních úloh.
Kdyby to otevřeli, třeba by tomu někdo napsal systémový ovladač, a začalo by se to chovat jako další procesory. I když mít v systému procesory dvou různých architektur by asi bylo celkem maso. K něčemu podobnému to ale stejně směřuje – mít část procesorů jen na grafiku a část na zbytek není optimální.
Re: co dál
celé vláknoTo právě ideální je, normálně máte v PC „procesor“ a k tomu další specializované procesory – pro desetinné výpočty (z dob 386tek), pro šifrování, pro multimedia (SSE, MMX, 3DNow), video program nomálně používá grafický procesor pro rozkomprimování videa, adt. Protože jednoúčelový (úzce zaměřený) procesor je asi 10× rychlejší než multifunkční, tak v budoucnosti budeme mít „grafiku“ uvnitř „procesoru“, procesor bude mít více jader, kt. budou každé trochu jinak zaměřené.
clanek o hovne
Chtel jsem se neco dozvedet, ale clanek stoji za uplne kulove. Chapu, ze autor za nej ma asi zaplaceno, takze snazi to tema natahnout neplodnym obecnym popularnim zvatlanim, ale ja, jako koder, bych ocenil nejaky motivacni zdrojak hned v prvnim prispevku tak, jak to maji skutecni muzi radi.

