Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Hlavní navigace

Názory k článku
CUDA: optimalizace přístupu do globální paměti

peter
peter (neregistrovaný) ---.asseco.sk
4. 8. 2009 7:32 Nový

chybicka se vloudila...

celé vlákno

Len taka mala poznamocka: Tipujem ze malo byt: cudaMemcpyHos­tToDevice Kopírování paměti z hosta do globální paměti ZARIZENI

Inak diki za fajn clanok.

Napalm
Napalm (neregistrovaný) ---.strcechy.adsl-llu.static.bluetone.cz
4. 8. 2009 8:59 Nový

Velikosti pamětí

celé vlákno

Dobrý článek. Jinak by to chtělo uvést velikosti jednotlivých pamětí.

Local – 16KB Shared – 16KB Constant – 64KB

(Strana 29, NVIDIA_CUDA_Bes­tPracticesGui­de2.3.pdf)

Přičemž shared memory je ještě o 32B menší. (0×4000 – 0×0020)

Procesory mají 8192 nebo 16384 registrů.

napalm aura:94
4. 8. 2009 9:07 Nový

Re: Velikosti pamětí

celé vlákno

A ještě bych doporučoval zmínit možnost využití Pinned memory na hostovi pro podstatně rychlejší kopírování mezi Device a Hostem a mapování paměti zařízení na paměť hosta.

Funkce cudaMallocHost.

Lukáš Zaorálek aura:44
4. 8. 2009 13:11 Nový

Re: Velikosti pamětí

celé vlákno

Bohužel se všechno do jednoho článku nevejde. Ale určitě bude problematika paměti (např. pinned memory) ještě probrána v dalších dílech.

d
d (neregistrovaný) ---.net.upc.cz
4. 8. 2009 10:52 Nový

Re: Velikosti pamětí

celé vlákno

Souhlas. To mi v článku chybělo, díky.

Pavel
Pavel (neregistrovaný) ---.etnetera.cz
4. 8. 2009 9:57 Nový

Re: CUDA: optimalizace přístupu do globální paměti

celé vlákno

Nemuzu rict, ze to zrovna chapu. Nebylo by mozne dalsi dil vydat v komiksove forme?

fsadfasdf
fsadfasdf (neregistrovaný) 193.179.215.---
4. 8. 2009 10:05 Nový

Re: CUDA: optimalizace přístupu do globální paměti

celé vlákno

chapat to zacnes az to budes potrebovat. dokud to nepotrebujes nutne tak se k tomu nedokazes intelektualne dokopat.

toor
toor (neregistrovaný) ---.chello.sk
4. 8. 2009 23:32 Nový

nieco univerzalnejsie...

celé vlákno

…by nebolo? Napr. ze si to nakodim na zahradke na nettope, doma vyskusam na ATI a pustim u kamarata gemblera na ultra-drahej grafike. (davam to sem, lebo tu je vyssia pravdepodobnost odpovede ako v 1.dieli)

vtech
vtech (neregistrovaný) ---.214.broadband10.iol.cz
4. 8. 2009 23:38 Nový

Re: nieco univerzalnejsie...

celé vlákno

OpenCL… …snad, jednou

Adam Konrád aura:94
6. 8. 2009 9:33 Nový

Banky

celé vlákno

Ještě jedna věc by stála za zmínku – paměťové banky a přístup do nich.

raziel
raziel (neregistrovaný) ---.net.upc.cz
15. 9. 2009 18:27 Nový

3. podmínka

celé vlákno

Dobrý den,

chtěl bych se zeptat na 3. podmínku:
Všech 16 elementů leží ve stejném segmentu, přičemž adresa prvního elementu musí být zarovnána k 16násobku velikosti elementu.

chtěl bych se zeptat, jak tuto podmínkou splním, jestli jsem to správně pochopil tak pokud mam pole intu, tak ukazatel na pole(první prvek) musí byt Nx4×16 (N = nějaký násobek, 4 = velikost intu,16 = z podmínky). takže pokud to tak je, tak by mě zajímalo jak to splním.:-/

Michal
Michal (neregistrovaný) ---.fme.vutbr.cz
3. 11. 2009 10:36 Nový

BlockDim.x není 3

celé vlákno

Chybička se vloudila do obr. cuda-3–1.png. BlockDim.x nemůže být 3, protože jinak by nevyšlo idx. Podle mě je BlockDim.x úplně špatně namalován a má být 4.

qweqwe
qweqwe (neregistrovaný) ---.228.broadband4.iol.cz
7. 4. 2010 20:24 Nový

Re: BlockDim.x není 3

celé vlákno

Taky jsem premyslel jak se muze 3*2+0 = 8

Dle meho nazoru by se melo to pocitat jako ID bloku * Pocet vlaken v bloku + ID vlakna nez ID bloku * Pocet bloku + ID vlakna.

Je tu nekdo, kdo ma v tomto jasno ?

qweqwe
qweqwe (neregistrovaný) ---.228.broadband4.iol.cz
7. 4. 2010 21:55 Nový

Re: BlockDim.x není 3

celé vlákno

z Cuda Programming Guide Version 3.0:

B.4.3 blockDim
This variable is of type dim3 (see Section B.3.2) and contains the dimensions of the block.

Tim padem je obrazek opravdu spatne a 3 ma byt 4 protoze se nejedna o pocet bloku, ale logicky o pocet vlaken v bloku.

Zasílat nově přidané příspěvky e-mailem