Resultados da pesquisa a pedido "cuda"

1 a resposta

Como implementar loops aninhados no impulso cuda

Atualmente, tenho que executar um loop aninhado da seguinte maneira: for(int i = 0; i < N; i++){ for(int j = i+1; j <= N; j++){ compute(...)//some calculation here } }Eu tentei deixar o primeiro loopCPU e faça o segundo loopGPU. Os resultados ...

1 a resposta

OpenCV CUDA executando mais lentamente que a CPU OpenCV

Estou lutando para que o OpenCV CUDA melhore o desempenho de coisas como corroer / dilatar, diferenciar quadros etc. quando leio um vídeo de um arquivo avi. típico, recebo metade do FPS na GPU (580gtx) do que na CPU (AMD 955BE). Antes de você ...

2 a resposta

FFTs 1D de colunas e linhas de uma matriz 3D em CUDA

Estou tentando calcular FFTs 1D em lote usandocufftPlanMany [http://docs.nvidia.com/cuda/cufft/#function-cufftplanmany]. O conjunto de dados é proveniente de um campo 3D, armazenado em uma matriz 1D, na qual desejo calcular FFTs 1D nax ey ...

1 a resposta

Como executar uma cópia profunda de struct com CUDA? [duplicado

Esta pergunta já tem uma resposta aqui: Copiar uma estrutura contendo ponteiros para o dispositivo CUDA [/questions/9309195/copying-a-struct-containing-pointers-to-cuda-device] 3 respostas Programação com CUDA Estou enfrentando um problema ao ...

2 a resposta

Como executar meu aplicativo CUDA no cartão ATI ou Intel no modo de software?

Eu quero ser capaz de executar o meu software no modo GPU no NVidia e no modo de CPU (sofware) na ATI ou Intel. Como posso conseguir isso?É o mesmo que o Phy...

1 a resposta

Redução de empuxo CUDA com duplos arrays

Eu tenho o seguinte código (compilável e executável) usando CUDA Thrust para realizar reduções de

1 a resposta

thrust :: max_element slow na comparação cublasIsamax - Implementação mais eficiente?

Preciso de uma implementação rápida e eficiente para encontrar o índice do valor máximo em uma matriz no CUDA. Esta operação precisa ser realizada várias vezes. Eu originalmente usei cublasIsamax para isso, no entanto, infelizmente, ele retorna o ...

5 a resposta

Como deixar cmake encontrar CUDA

6 a resposta

CUDA matrizes dinâmicas globais (como em C) alocadas na memória do dispositivo

Então, estou tentando escrever um código que utiliza a arquitetura CUDA da Nvidia. Percebi que copiar para e do dispositivo estava realmente prejudicando meu desempenho geral, então agora estou tentando mover uma grande quantidade de dados para o ...

2 a resposta

Como posso configurar o nvcc para usar o Visual C ++ Express 2010 x64 do Windows SDK 7.

Estou criando aplicativos de 64 bits com o Visual C ++ Express 2010 estendido com o Windows SDK 7.1 (para adicionar o compilador de 64 bits). Quando eu uso o nvcc no modo de 32 bits, ele funciona bem. Quando o uso no modo de 64 bits, recebo este ...