Hlavní navigace

Připojení k Internetu

Jak se měří internet pomocí sond

Názory k článku
Úvod do technologie CUDA

Hulka
Hulka (neregistrovaný) 94.138.100.---
20. 7. 2009 1:58 Nový

Že by další revoluce?

celé vlákno

Ten graf vznikl z výsledku měření na výkon z hlediska operací které běžně provádí GPU nebo CPU? I když jsou dnes GPU velmi rychlá připadá mi absurdní že by takto na poli CPU dominovala nvidia :), jinak se zde porovnává neporovnatelné.

Hulka
Hulka (neregistrovaný) 94.138.100.---
20. 7. 2009 2:20 Nový

Re: Že by další revoluce?

celé vlákno

A ještě něco. V úvodu článku se píše že by bylo hezký využít GPU k něčemu jinému nežli k 2D a 3D. Potom nevím co takový GPU počítá u zpracování videa, filmu či offline renderingu :). U vědy a medicíny se autor raději vyhnul konkretizaci. Skoro jakoby tu byla důležitější značka grafické karty nežli podstata technologie která je tu prezentována.

dolik.rce
dolik.rce (neregistrovaný) ---.resnet.pdx.edu
20. 7. 2009 5:18 Nový

Re: Že by další revoluce?

celé vlákno

Jako zástupce vědy si dovolím konkretizovat: ve fyzice je velmi často třeba počítat Fourierovu transformaci, pro velké soubory dat (a často také mnoho takových souborů). A pro takové úkoly je GPU jako stvořené.

Chroby
Chroby (neregistrovaný) ---.ppp-bb.dion.ne.jp
20. 7. 2009 5:38 Nový

Re: Že by další revoluce?

celé vlákno

A samozřejmě nejen Fourierovu transformaci … libovolné výpočty vektory/poly, kdy se na jednotlivé prvky aplikuje stejná operace, jsou pro výpočty na GPU jako stvořené. To zahrnuje kromě Fourierovy transformace i lineární algebru, numerické řešení diferenciálních rovnic nebo zpracování obrazu. Ve výsledku to může dát pěknou medicínskou aplikaci na analýzu dat třeba z magnetické rezonance.

Strec
Strec (neregistrovaný) ---.mxnet.mel.nist.gov
20. 7. 2009 16:03 Nový

Re: Že by další revoluce?

celé vlákno

Ja bych jako zastupce vedy taky konkretizoval zhruba stejne. Hodne Fourierek, velke mnozstvi dat a rychle a paralelne.

Biktop
Biktop (neregistrovaný) ---.28.broadband3.iol.cz
20. 7. 2009 18:59 Nový

Re: Že by další revoluce?

celé vlákno

Já bych, co by bývalý „zástupce vědy“ (LOL! :-D), namítnul, že numerické výpočty je třeba dělat s nějakou rozumnou přesností a přesně definovanou chybou, což možnost využití GPU v této oblasti značně problematizuje.

Chroby
Chroby (neregistrovaný) ---.ppp-bb.dion.ne.jp
21. 7. 2009 3:44 Nový

Re: Že by další revoluce?

celé vlákno

A v čem spočívá ten problém?

pe25tr
pe25tr (neregistrovaný) 195.39.114.---
21. 7. 2009 8:02 Nový

Re: Že by další revoluce?

celé vlákno

problem je typ float, nebo chces-li single precision

velurex
velurex (neregistrovaný) ---.kdyne.net
21. 7. 2009 13:53 Nový

Re: Že by další revoluce?

celé vlákno

Novější karty od NVidie (tuším počínaje GTX280) umí double precision.

Vinc
Vinc (neregistrovaný) ---.dkm.cz
21. 7. 2009 22:03 Nový

Re: Že by další revoluce?

celé vlákno

a nebo Tesla…

Peca
Peca (neregistrovaný) ---.cust.nbox.cz
12. 8. 2009 22:13 Nový

Re: Že by další revoluce?

celé vlákno

Double precision jednotka je na GT 200 čipech pořád jenom jedna na multiprocesor (stejně jako dělička), takže pořád nic moc. Ale jde to použít pro rychlou aproximaci a dopočítat to pak na CPU.

Ivan Nový
Ivan Nový (neregistrovaný) ---.client.ufon.cz
23. 7. 2009 10:05 Nový

Re: Že by další revoluce?

celé vlákno

No grafická karta se dá využít i k akceleraci třídění dat. Viz stránky k CUDA. Tam jsou i příklady aplikací.

Chroby
Chroby (neregistrovaný) ---.ppp-bb.dion.ne.jp
20. 7. 2009 5:27 Nový

Re: Že by další revoluce?

celé vlákno

Ten graf bude nejspíš ukazovat maximální teoretický počet floating-point operací za sekundu (viz. svislá osa), tedy operací, které běžně provádějí CPU i GPU. Nevznikl asi z žádného konkrétního měření a v praxi bude dosažitelný počet FLOP samozřejmě nižší. Kdyby v tom grafu bylo i ATI, předpokládám, že by se křivka pohybovala v okolí nvidie, rozhodně nad libovolným CPU.

android
android (neregistrovaný) ---.4.12.vie.surfer.at
20. 7. 2009 6:58 Nový

Jen dodatek

celé vlákno

GPU je pekelne rychle ovsem data nad kterymi pracuje musi byt v pameti na graficke karte a ty presuny stoji neco casu. Pokud se nad daty nedela na GPU vice operaci, pak se vyplati to same spocitat na beznem CPU.

A do toho jeste vstupuje dulezita promena – cas programatora.

velurex
velurex (neregistrovaný) ---.kdyne.net
20. 7. 2009 7:38 Nový

Re: Jen dodatek

celé vlákno

Tak, tak. Já byl poměrně zklamaný režií nutnou ke kopírování dat na grafickou kartu a po výpočtu zpět. Pro matici 50×50 se mi to nevyplatilo. Člověk musí opravdu pracovat s objemem dat nad stovky kb, ale pak to skutečně stojí za to. :) Zrychlení určitých algoritmů až 100× je reálné.

xurfa
xurfa (neregistrovaný) ---.adsl.sky.cz
20. 7. 2009 8:31 Nový

Re: Jen dodatek

celé vlákno

asi proto se snazi AMD nacpat „grafiku“ primo do CPU, ze?

pe25tr
pe25tr (neregistrovaný) 195.39.114.---
20. 7. 2009 8:00 Nový

Re: Jen dodatek

celé vlákno

Jojo. Az nekdo udela pro GPU Linearni solver (GMRes) pro matice radu stovek tisic, pak koupim poradnou grafiku :)).

Jakub Velímský aura:10

Re: Jen dodatek

celé vlákno

Chtělo by to, aby nvidia optimalizovala pro CUDA alespoň BLAS a LAPACK. Jak mám sakra ve Fortranu kopírovat data do a z paměti grafické karty? :-)

Santa
Santa (neregistrovaný) ---.fi.muni.cz
20. 7. 2009 10:35 Nový

Re: Jen dodatek

celé vlákno

A nejsou tyto knihovny předělané pro CUDA náhodou už dávno dostupné přímo od nVidie?

Jakub Velímský aura:10

Re: Jen dodatek

celé vlákno

Pokud vím, tak BLAS ano (CUBLAS), ale LAPACK zatím ne a přilinkování CUBLASu do neoptimalizovaného LAPACKu není efektivní právě pro neustálé kopírování z a do paměti grafické karty. Ale sám jsem to nezkoušel.

tomas
tomas (neregistrovaný) ---.149.102.109.adsl.nextra.cz
20. 7. 2009 18:12 Nový

Re: Jen dodatek

celé vlákno
xurfa
xurfa (neregistrovaný) ---.adsl.sky.cz
20. 7. 2009 8:29 Nový

věda, medicína, zpracování videa, film, offline rendering, apod

celé vlákno

to zní jako z nejakeho priblbleho PR clanku… :(((

FxF
FxF (neregistrovaný) ---.karneval.cz
20. 7. 2009 10:36 Nový

Re: věda, medicína, zpracování videa, film, offline rendering, apod

celé vlákno

Tady máte ukázku výkonu pro vcelku praktickou a přitom vysoce náročnou aplikaci při numerické předpovědi počasí. Je tam taky dobře vidět výše zmiňovaná režie za načítání dat do gr. karty a zpět.

GPU Acceleration of NWP: Benchmark Kernels Web Page

Zdenek
Zdenek (neregistrovaný) ---.anonymouse.org
20. 7. 2009 10:58 Nový

Re: Úvod do technologie CUDA

celé vlákno

Ale dejte pokoj s FFT ;-) Tady je ponekud praktictejsi pouziti CUDA pro obycejne lidi ;-)

sfgdg
sfgdg (neregistrovaný) 193.179.215.---
20. 7. 2009 13:09 Nový

Re: Úvod do technologie CUDA

celé vlákno

obycejni lide, kteri se chcou zabyvat CUDA vetsinou povazuji FFT za „obycejnou“ vec :-)

Phokz
Phokz (neregistrovaný) ---.caplan.cz
20. 7. 2009 17:54 Nový

pattern matching

Ahoj, já bych zase rád viděl pomocí gpu pattern matching. To je silně parelelizovatelná záležitost a pomocí CPU je to pomalé.

Představte si třeba clamav nebo dspam pro GPU.

Zkuste běžným počítačem udělat wire speed antispam.

A nebo zone minder pro GPU. V plném palu běžný CPU zabijí jednotky kamer.

frosty
frosty (neregistrovaný) ---.adsl.slovanet.sk
21. 7. 2009 1:15 Nový

GPGPU

celé vlákno

mna by zaujimalo ako sa GPGPU vyvynie ak to ma existovat pre vsetky karty nie len nvidia

frosty
frosty (neregistrovaný) ---.adsl.slovanet.sk
21. 7. 2009 1:18 Nový

Re: GPGPU

celé vlákno

teraz som nasiel ze opencl by malo byt univerzalne. je potom nejaky dovod pouzivat CUDA ak funguje len na jednych kartach?

Peca
Peca (neregistrovaný) ---.cust.nbox.cz
12. 8. 2009 22:16 Nový

Re: GPGPU

celé vlákno

Chystá se OpenCL, ale zatím je to v plenkách a CUDA taky víc těží z přímé vazby na HW, což u OpenCL musí řešit překladač.

janik
janik (neregistrovaný) 62.134.46.---
21. 7. 2009 8:00 Nový

CUDA Driver

Ten nazov balicku je mi povedomy. Obsahuju uz standardne balicky s ovladacom pre grafiku aj CUDA? Alebo je nejaky sposob ako zistim ci uz ten spravny driver mam?

Diky.

VM
VM (neregistrovaný) ---.net.upc.cz
21. 7. 2009 11:24 Nový

co dál

celé vlákno

Mohli by to víc otevřít. Takhle to je jen proprietární hračka na pár speciálních úloh.

Kdyby to otevřeli, třeba by tomu někdo napsal systémový ovladač, a začalo by se to chovat jako další procesory. I když mít v systému procesory dvou různých architektur by asi bylo celkem maso. K něčemu podobnému to ale stejně směřuje – mít část procesorů jen na grafiku a část na zbytek není optimální.

marek
marek (neregistrovaný) ---.22.40.149.adsl.nextra.cz
27. 7. 2009 2:04 Nový

Re: co dál

celé vlákno

To právě ideální je, normálně máte v PC „procesor“ a k tomu další specializované procesory – pro desetinné výpočty (z dob 386tek), pro šifrování, pro multimedia (SSE, MMX, 3DNow), video program nomálně používá grafický procesor pro rozkomprimování videa, adt. Protože jednoúčelový (úzce zaměřený) procesor je asi 10× rychlejší než multifunkční, tak v budoucnosti budeme mít „grafiku“ uvnitř „procesoru“, procesor bude mít více jader, kt. budou každé trochu jinak zaměřené.

Trm
Trm (neregistrovaný) 94.74.208.---
24. 7. 2009 17:30 Nový

clanek o hovne

Chtel jsem se neco dozvedet, ale clanek stoji za uplne kulove. Chapu, ze autor za nej ma asi zaplaceno, takze snazi to tema natahnout neplodnym obecnym popularnim zvatlanim, ale ja, jako koder, bych ocenil nejaky motivacni zdrojak hned v prvnim prispevku tak, jak to maji skutecni muzi radi.

Zasílat nově přidané příspěvky e-mailem