4. 8. 2009 8:59
Dobrý článek. Jinak by to chtělo uvést velikosti jednotlivých pamětí.
Local – 16KB Shared – 16KB Constant – 64KB
(Strana 29, NVIDIA_CUDA_BestPracticesGuide2.3.pdf)
Přičemž shared memory je ještě o 32B menší. (0×4000 – 0×0020)
Procesory mají 8192 nebo 16384 registrů.
4. 8. 2009 9:07
A ještě bych doporučoval zmínit možnost využití Pinned memory na hostovi pro podstatně rychlejší kopírování mezi Device a Hostem a mapování paměti zařízení na paměť hosta.
Funkce cudaMallocHost.
4. 8. 2009 13:11
Bohužel se všechno do jednoho článku nevejde. Ale určitě bude problematika paměti (např. pinned memory) ještě probrána v dalších dílech.
4. 8. 2009 10:52
Souhlas. To mi v článku chybělo, díky.