Resultados da pesquisa a pedido "cuda"

2 a resposta

Thrust: Removendo duplicatas em matrizes de valores-chave

Tenho um par de matrizes de tamanho igual, chamarei de chaves e valore Por exemplo K: V 1: 99 1: 100 1: 100 1: 100 1: 103 2: 103 2: 105 3: 45 3: 67As chaves são classificadas e os valores associadoscom cada tecla são ordenados. Como é que ...

5 a resposta

alocar memória compartilhada

Estou tentando alocar memória compartilhada usando um parâmetro constante, mas obtendo um erro. meu kernel fica assim: __global__ void Kernel(const int count) { __shared__ int a[count]; }e estou recebendo um erro dizendo erro: a expressão ...

1 a resposta

CUDA como obter grade, bloco, tamanho da rosca e paralelizar o cálculo de matriz não quadrada

Sou novo na CUDA e preciso de ajuda para entender algumas coisas. Preciso de ajuda para paralelizar esses dois para loops. Especificamente, como configurar o dimBlock e o dimGrid para tornar isso mais rápido. Eu sei que isso se parece com o ...

1 a resposta

esolução de matrizes com C (dentro da CUD

omo parte de um problema maior, preciso resolver pequenos sistemas lineares (ou seja, NxN, onde N ~ 10), para que as bibliotecas cuda relevantes não façam sentido em termos de velocidad Infelizmente, algo que também não está claro é como ...

1 a resposta

CUDA: Chamando uma função __device__ de um kernel

Tenho um kernel que chamadispositiv dentro de uma instrução if. O código é o seguinte: __device__ void SetValues(int *ptr,int id) { if(ptr[threadIdx.x]==id) //question related to here ptr[threadIdx.x]++; } __global__ void Kernel(int *ptr) ...

3 a resposta

Lidando com condições de contorno / regiões Halo em CUDA

Estou trabalhando no processamento de imagens com a CUDA e tenho uma dúvida sobre o processamento de pixel O que geralmente é feito com os pixels de limite de uma imagem ao aplicar umm x m filtro de convolução? Em um3 x 3 kernel de convolução, ...

3 a resposta

Por que a memória fixada pela CUDA é tão rápida?

Observo acelerações substanciais na transferência de dados quando uso memória fixada para transferências de dados CUDA. No linux, a chamada subjacente do sistema para conseguir isso é mlock. Na página de manual do mlock, ele afirma que o ...

1 a resposta

CUDA: cudaEvent_t e cudaThreadSynchronize use

Estou um pouco confuso sobre o uso decudaEvent_t. Atualmente, estou usando oclock() chame assim para encontrar a duração de uma chamada do kernel: cudaThreadSynchronize(); clock_t begin = clock(); fooKernel<<< x, y >>>( z, w ...

1 a resposta

O que os itens de trabalho executam quando condicionais são usados na programação da GP

Se você tiver itens de trabalho em execução em uma frente de onda e houver um condicional como: if(x){ ... } else{ .... }O que os itens de trabalho executam? é o caso em que todos os itens de trabalho na frente de onda executam a primeira ...

4 a resposta

Programação de CUDA usando Delphi ou FreePascal

Posso criar aplicativos CUDA / OpenCL usando Delphi ou FreePascal? Ou sou forçado a usar C ++ e Visual Studi Uma pesquisa rápida:cuda + pascal [http://www.google.com/search?btnG=1&pws=0&q=cuda%20pascal] Liga alguns leads promissores, mas nenhum ...