CUDA uniu o acesso à memória global

Question

Apr 26, 2012, 01:30 AM

CUDA uniu o acesso à memória global

Eu li o guia de programação CUDA, mas perdi uma coisa. Digamos que eu tenha matriz de 32 bits int na memória global e eu quero copiá-lo para a memória compartilhada com acesso coalescido. O array global tem índices de 0 a 1024, e digamos que eu tenha 4 blocos cada com 256 threads.

<code>__shared__ int sData[256];
</code>

Quando é feito o acesso coalescido?

1

<code>sData[threadIdx.x] = gData[threadIdx.x * blockIdx.x+gridDim.x*blockIdx.y];
</code>

Endereços na memória global são copiados de 0 a 255, cada um por 32 threads em dobra, então aqui está tudo bem?

2

<code>sData[threadIdx.x] = gData[threadIdx.x * blockIdx.x+gridDim.x*blockIdx.y + someIndex];
</code>

Se someIndex não é múltiplo de 32, não é coalescido? Endereços desalinhados? Isso está correto?

questionAnswers(4)

Perguntas populares

0 a resposta

window.onload vs $ (document) .ready ()

0 a resposta

Mcrypt e base64 com PHP e c #

0 a resposta

Como aplicar o gatilho de estilo ao datatemplate no WPF

0 a resposta

Validação do controle de upload de arquivo usando jquery

0 a resposta

odificando uma passagem de parâmetro para um script (Bas

Você é muito ativo! É ótimo!

CUDA uniu o acesso à memória global

questionAnswers(4)

yourAnswerToTheQuestion

Perguntas populares