Resultados da pesquisa a pedido "cuda"
Thrust: Removendo duplicatas em matrizes de valores-chave
Tenho um par de matrizes de tamanho igual, chamarei de chaves e valore Por exemplo K: V 1: 99 1: 100 1: 100 1: 100 1: 103 2: 103 2: 105 3: 45 3: 67As chaves são classificadas e os valores associadoscom cada tecla são ordenados. Como é que ...
alocar memória compartilhada
Estou tentando alocar memória compartilhada usando um parâmetro constante, mas obtendo um erro. meu kernel fica assim: __global__ void Kernel(const int count) { __shared__ int a[count]; }e estou recebendo um erro dizendo erro: a expressão ...
CUDA como obter grade, bloco, tamanho da rosca e paralelizar o cálculo de matriz não quadrada
Sou novo na CUDA e preciso de ajuda para entender algumas coisas. Preciso de ajuda para paralelizar esses dois para loops. Especificamente, como configurar o dimBlock e o dimGrid para tornar isso mais rápido. Eu sei que isso se parece com o ...
esolução de matrizes com C (dentro da CUD
omo parte de um problema maior, preciso resolver pequenos sistemas lineares (ou seja, NxN, onde N ~ 10), para que as bibliotecas cuda relevantes não façam sentido em termos de velocidad Infelizmente, algo que também não está claro é como ...
CUDA: Chamando uma função __device__ de um kernel
Tenho um kernel que chamadispositiv dentro de uma instrução if. O código é o seguinte: __device__ void SetValues(int *ptr,int id) { if(ptr[threadIdx.x]==id) //question related to here ptr[threadIdx.x]++; } __global__ void Kernel(int *ptr) ...
Lidando com condições de contorno / regiões Halo em CUDA
Estou trabalhando no processamento de imagens com a CUDA e tenho uma dúvida sobre o processamento de pixel O que geralmente é feito com os pixels de limite de uma imagem ao aplicar umm x m filtro de convolução? Em um3 x 3 kernel de convolução, ...
Por que a memória fixada pela CUDA é tão rápida?
Observo acelerações substanciais na transferência de dados quando uso memória fixada para transferências de dados CUDA. No linux, a chamada subjacente do sistema para conseguir isso é mlock. Na página de manual do mlock, ele afirma que o ...
CUDA: cudaEvent_t e cudaThreadSynchronize use
Estou um pouco confuso sobre o uso decudaEvent_t. Atualmente, estou usando oclock() chame assim para encontrar a duração de uma chamada do kernel: cudaThreadSynchronize(); clock_t begin = clock(); fooKernel<<< x, y >>>( z, w ...
O que os itens de trabalho executam quando condicionais são usados na programação da GP
Se você tiver itens de trabalho em execução em uma frente de onda e houver um condicional como: if(x){ ... } else{ .... }O que os itens de trabalho executam? é o caso em que todos os itens de trabalho na frente de onda executam a primeira ...
Programação de CUDA usando Delphi ou FreePascal
Posso criar aplicativos CUDA / OpenCL usando Delphi ou FreePascal? Ou sou forçado a usar C ++ e Visual Studi Uma pesquisa rápida:cuda + pascal [http://www.google.com/search?btnG=1&pws=0&q=cuda%20pascal] Liga alguns leads promissores, mas nenhum ...