Resultados da pesquisa a pedido "cuda"
Contar ocorrências de números em uma matriz CUDA
Tenho uma matriz de números inteiros não assinados armazenados na GPU com CUDA (normalmente1000000 elementos). Eu gostaria de contar a ocorrência de todos os números na matriz. Existem apenas alguns números distintos (cerca de10), mas esses ...
xemplo mais simples possível para mostrar a CPU com desempenho superior à GPU usando CUDA
Estou procurando a quantidade mais concisa de código possível que pode ser codificada para uma CPU (usando g ++) e uma GPU (usando nvcc) para as quais a GPU supera consistentemente a CPU. Qualquer tipo de algoritmo é aceitáve Para esclarecer: ...
Quanta memória posso realmente alocar em um cartão cuda
Estou escrevendo um processo de servidor que executa cálculos em uma GPU usando cuda. Desejo enfileirar solicitações recebidas até que haja memória suficiente disponível no dispositivo para executar o trabalho, mas estou tendo dificuldades para ...
Encontrando o valor máximo do elemento E sua posição usando o CUDA Thrust
Como obtenho não apenas o valor, mas também a posição do elemento máximo (mínimo) res.val eres.pos)? thrust::host_vector<float> h_vec(100); thrust::generate(h_vec.begin(), h_vec.end(), rand); thrust::device_vector<float> d_vec = h_vec; T res = ...
Error: BFS na sincronização CUDA
Meu código a seguir recebeu um erro, quando executado, alguns dos pesos do gráfico estão sendo substituídos, mas isso não deveria estar acontecendo com a matriz Xa (que mantém quais já foram visitadas) e a função __syncthreads () ... Alguém pode ...
nde a CUDA aloca o quadro da pilha para os kernel
A minha chamada ao kernel falha com "falta de memória". Faz uso significativo do quadro da pilha e fiquei pensando se esse é o motivo de sua falh Quando invocar o nvcc com --ptxas-options = -v, imprime as seguintes informações de ...
Timing das operações CUDA
Preciso cronometrar uma execução do kernel CUDA. O Guia de práticas recomendadas diz que podemos usar eventos ou funções de tempo padrão comoclock() no Windows. Meu problema é que o uso dessas duas funções me dá um resultado totalmente ...
CUDA matrizes dinâmicas globais (como em C) alocadas na memória do dispositivo
Então, estou tentando escrever um código que utiliza a arquitetura CUDA da Nvidia. Percebi que copiar para e do dispositivo estava realmente prejudicando meu desempenho geral, então agora estou tentando mover uma grande quantidade de dados para o ...
Quando a memória __shared__ da CUDA é útil?
Alguém pode me ajudar com um exemplo muito simples de como usar a memória compartilhada? O exemplo incluído no guia de programação Cuda C parece confuso com detalhes irrelevantes. Por exemplo, se eu copiar uma grande matriz para a memória ...
Erro ao compilar CUDA a partir do Prompt de Comando
Estou tentando compilar um programa de teste cuda no Windows 7 via Prompt de Comando, sou este comando: nvcc test.cu Mas tudo o que recebo é este erro: nvcc fatal : Cannot find compiler 'cl.exe' in PATHO que pode estar causando esse erro?