ocenuji, ze na root zacali psat i dalsi lidi, kteri necemu rozumi… nicmene, ten clanek je totalne necitelny. at uz diky absenci odstavcu nebo diky snaze vysvetlit vse na jednou. schvalne, at zvedne ruku, kdo si mysli, ze pochopil ten sileny druhy odstavec!
poznamka pro korektora: ,,standartní'' … myslim, ze takhle se to slovo nepise ;-]
Ja se jen podivuji nad tim radkem s vystupem spusteneho programu. 1) Co tam dela prompt shellu ? Bezelo to snad asynchronne (tj. bylo spusteno pomoci &) a shell stacil napsat prompt, nez to dobehlo ? 2) Ve zdrojaku bylo psano „Hello CUDA!“, ale ve vyslednem vystupu je videt „Hello Cuda!“ Prehledl jsem snad nejaky tolower() ? Nebo ze by to autor trosku, ale jen opravdu trosicku osvindloval :-) ?
Dělal jsem na tom diplomku, docela mě to nadchlo http://petr.pospichal.biz/…xpospi45.pdf
To by bylo špatně z důvodů: • Jádro je načteno souvisle od 1MB RAM, tedy jen pro CPU. • Grafická karta je potenciálně nespolehlivá a nelze ohrozit stabilitu systému jako je Linux druhojakostní komponentou. Viz VPU-Recover (no dobře, ten je ATI, ale princip je zřejmý). • Jádro se má psát efektivně. Hotspoty v kódu se mohou optimalizovat v assembleru.
chapu argumenty, ale spustit nejake jaderne funkce na GPU by mohlo byt zajimave. v teto sousvislosti me napada dotaz na cell procesor, jenz ma jedno „kvalitni“ CPU a jadro a dalsi „omezena“ specificka jadra, zda kernel pouziva jen to kvalitni jadro a omezena jadra slouzi jen pro userland (vypocty, multimedia…) ?
Pridavam se k ostatnim, ze clanek je temer nepochopitelny pro cloveka neznaleho GPU a CUDA. Autor mel nejprve radne popsat architekturu GPU, z cehoz vyplyne, proc se zabyvame vecmi jako bloky a gridy – je to kvuli synchronizaci mezi vlakny. Bez vylozeni, jak se zpracovavaji vlakna v ramci bloku a gridu nema smysl jit dal a zminovat veci jako coalesced memory acces. Pak bych rekl, co je to kernel a jak se spousti. A potom by zrejme bylo dobre podrobne vylozit, jak dostat data ke zpracovani do globalni pameti GPU, pripadne do sdilene pameti multiprocesoru (ta je sdilena na urovni bloku, a jelikoz autor radne nevysvetlil bloky, tezko muze vysvetlit toto). O necitelnosti kodu se snad ani nezminuji. Opravdu jsou lepsi tutorialy primo od nVidie, napr.
http://geraldine.fjfi.cvut.cz/~oberhuber/data/hpc/paa/prezentace/Getting_Started_w_CUDA_Training_NVISION08.pdf
Je len dobre, ze sa taketo temy zacali objavovat. Je ale fakt ze clanok je dost tazko citatelny. Chcelo by to zapojit este niekoho kto vysledny text preluska. Inak zacali napr. Matlab (s ktorym pracujeme denne) uz tieto veci vyuziva
http://www.posterus.sk/?p=1661
a je to celkom prinos.
Internet Info Root.cz (www.root.cz)
Informace nejen ze světa Linuxu. ISSN 1212-8309
Copyright © 1998 – 2021 Internet Info, s.r.o. Všechna práva vyhrazena.