Vlákno názorů k článku CUDA: optimalizace přístupu do globální paměti od Napalm - Dobrý článek. Jinak by to chtělo uvést velikosti...

4. 8. 2009 8:59

Napalm (neregistrovaný)

Dobrý článek. Jinak by to chtělo uvést velikosti jednotlivých pamětí.

Local – 16KB Shared – 16KB Constant – 64KB

(Strana 29, NVIDIA_CUDA_BestPracticesGuide₂.3.pdf)

Přičemž shared memory je ještě o 32B menší. (0×4000 – 0×0020)

Procesory mají 8192 nebo 16384 registrů.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 8. 2009 9:07

bez přezdívky

A ještě bych doporučoval zmínit možnost využití Pinned memory na hostovi pro podstatně rychlejší kopírování mezi Device a Hostem a mapování paměti zařízení na paměť hosta.

Funkce cudaMallocHost.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 8. 2009 13:11

bez přezdívky

Bohužel se všechno do jednoho článku nevejde. Ale určitě bude problematika paměti (např. pinned memory) ještě probrána v dalších dílech.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 8. 2009 10:52

d (neregistrovaný)

Souhlas. To mi v článku chybělo, díky.

Dále u nás najdete