Resultados da pesquisa a pedido "cuda"
Como implementar loops aninhados no impulso cuda
Atualmente, tenho que executar um loop aninhado da seguinte maneira: for(int i = 0; i < N; i++){ for(int j = i+1; j <= N; j++){ compute(...)//some calculation here } }Eu tentei deixar o primeiro loopCPU e faça o segundo loopGPU. Os resultados ...
OpenCV CUDA executando mais lentamente que a CPU OpenCV
Estou lutando para que o OpenCV CUDA melhore o desempenho de coisas como corroer / dilatar, diferenciar quadros etc. quando leio um vídeo de um arquivo avi. típico, recebo metade do FPS na GPU (580gtx) do que na CPU (AMD 955BE). Antes de você ...
FFTs 1D de colunas e linhas de uma matriz 3D em CUDA
Estou tentando calcular FFTs 1D em lote usandocufftPlanMany [http://docs.nvidia.com/cuda/cufft/#function-cufftplanmany]. O conjunto de dados é proveniente de um campo 3D, armazenado em uma matriz 1D, na qual desejo calcular FFTs 1D nax ey ...
Como executar uma cópia profunda de struct com CUDA? [duplicado
Esta pergunta já tem uma resposta aqui: Copiar uma estrutura contendo ponteiros para o dispositivo CUDA [/questions/9309195/copying-a-struct-containing-pointers-to-cuda-device] 3 respostas Programação com CUDA Estou enfrentando um problema ao ...
Como executar meu aplicativo CUDA no cartão ATI ou Intel no modo de software?
Eu quero ser capaz de executar o meu software no modo GPU no NVidia e no modo de CPU (sofware) na ATI ou Intel. Como posso conseguir isso?É o mesmo que o Phy...
Redução de empuxo CUDA com duplos arrays
Eu tenho o seguinte código (compilável e executável) usando CUDA Thrust para realizar reduções de
thrust :: max_element slow na comparação cublasIsamax - Implementação mais eficiente?
Preciso de uma implementação rápida e eficiente para encontrar o índice do valor máximo em uma matriz no CUDA. Esta operação precisa ser realizada várias vezes. Eu originalmente usei cublasIsamax para isso, no entanto, infelizmente, ele retorna o ...
CUDA matrizes dinâmicas globais (como em C) alocadas na memória do dispositivo
Então, estou tentando escrever um código que utiliza a arquitetura CUDA da Nvidia. Percebi que copiar para e do dispositivo estava realmente prejudicando meu desempenho geral, então agora estou tentando mover uma grande quantidade de dados para o ...
Como posso configurar o nvcc para usar o Visual C ++ Express 2010 x64 do Windows SDK 7.
Estou criando aplicativos de 64 bits com o Visual C ++ Express 2010 estendido com o Windows SDK 7.1 (para adicionar o compilador de 64 bits). Quando eu uso o nvcc no modo de 32 bits, ele funciona bem. Quando o uso no modo de 64 bits, recebo este ...