Dobrý článek. Jinak by to chtělo uvést velikosti jednotlivých pamětí.
Local – 16KB Shared – 16KB Constant – 64KB
(Strana 29, NVIDIA_CUDA_BestPracticesGuide2.3.pdf)
Přičemž shared memory je ještě o 32B menší. (0×4000 – 0×0020)
Procesory mají 8192 nebo 16384 registrů.
Dobrý den,
chtěl bych se zeptat na 3. podmínku:
Všech 16 elementů leží ve stejném segmentu, přičemž adresa prvního elementu musí být zarovnána k 16násobku velikosti elementu.
chtěl bych se zeptat, jak tuto podmínkou splním, jestli jsem to správně pochopil tak pokud mam pole intu, tak ukazatel na pole(první prvek) musí byt Nx4×16 (N = nějaký násobek, 4 = velikost intu,16 = z podmínky). takže pokud to tak je, tak by mě zajímalo jak to splním.:-/
z Cuda Programming Guide Version 3.0:
B.4.3 blockDim
This variable is of type dim3 (see Section B.3.2) and contains the dimensions of the block.
Tim padem je obrazek opravdu spatne a 3 ma byt 4 protoze se nejedna o pocet bloku, ale logicky o pocet vlaken v bloku.