Resultados da pesquisa a pedido "cuda"

3 a resposta

Contar ocorrências de números em uma matriz CUDA

Tenho uma matriz de números inteiros não assinados armazenados na GPU com CUDA (normalmente1000000 elementos). Eu gostaria de contar a ocorrência de todos os números na matriz. Existem apenas alguns números distintos (cerca de10), mas esses ...

4 a resposta

xemplo mais simples possível para mostrar a CPU com desempenho superior à GPU usando CUDA

Estou procurando a quantidade mais concisa de código possível que pode ser codificada para uma CPU (usando g ++) e uma GPU (usando nvcc) para as quais a GPU supera consistentemente a CPU. Qualquer tipo de algoritmo é aceitáve Para esclarecer: ...

1 a resposta

Quanta memória posso realmente alocar em um cartão cuda

Estou escrevendo um processo de servidor que executa cálculos em uma GPU usando cuda. Desejo enfileirar solicitações recebidas até que haja memória suficiente disponível no dispositivo para executar o trabalho, mas estou tendo dificuldades para ...

2 a resposta

Encontrando o valor máximo do elemento E sua posição usando o CUDA Thrust

Como obtenho não apenas o valor, mas também a posição do elemento máximo (mínimo) res.val eres.pos)? thrust::host_vector<float> h_vec(100); thrust::generate(h_vec.begin(), h_vec.end(), rand); thrust::device_vector<float> d_vec = h_vec; T res = ...

1 a resposta

Error: BFS na sincronização CUDA

Meu código a seguir recebeu um erro, quando executado, alguns dos pesos do gráfico estão sendo substituídos, mas isso não deveria estar acontecendo com a matriz Xa (que mantém quais já foram visitadas) e a função __syncthreads () ... Alguém pode ...

2 a resposta

nde a CUDA aloca o quadro da pilha para os kernel

A minha chamada ao kernel falha com "falta de memória". Faz uso significativo do quadro da pilha e fiquei pensando se esse é o motivo de sua falh Quando invocar o nvcc com --ptxas-options = -v, imprime as seguintes informações de ...

5 a resposta

Timing das operações CUDA

Preciso cronometrar uma execução do kernel CUDA. O Guia de práticas recomendadas diz que podemos usar eventos ou funções de tempo padrão comoclock() no Windows. Meu problema é que o uso dessas duas funções me dá um resultado totalmente ...

6 a resposta

CUDA matrizes dinâmicas globais (como em C) alocadas na memória do dispositivo

Então, estou tentando escrever um código que utiliza a arquitetura CUDA da Nvidia. Percebi que copiar para e do dispositivo estava realmente prejudicando meu desempenho geral, então agora estou tentando mover uma grande quantidade de dados para o ...

2 a resposta

Quando a memória __shared__ da CUDA é útil?

Alguém pode me ajudar com um exemplo muito simples de como usar a memória compartilhada? O exemplo incluído no guia de programação Cuda C parece confuso com detalhes irrelevantes. Por exemplo, se eu copiar uma grande matriz para a memória ...

5 a resposta

Erro ao compilar CUDA a partir do Prompt de Comando

Estou tentando compilar um programa de teste cuda no Windows 7 via Prompt de Comando, sou este comando: nvcc test.cu Mas tudo o que recebo é este erro: nvcc fatal : Cannot find compiler 'cl.exe' in PATHO que pode estar causando esse erro?