Resultados da pesquisa a pedido "cuda"
Instalando o theano no Windows 8 com GPU ativada
Entendo que o suporte Theano ao Windows 8.1 está apenas em fase experimental, mas será que alguém teve sorte em resolver meus problemas. Dependendo da minha configuração, recebo três tipos distintos de erros. Presumo que a resolução de qualquer ...
O CUDA parece não compilar
Atualmente, estou executando o CUDA 5.0 Toolkit no meu Visual Studio 2012 Express. Eu tentei executar o seguinte código Eu pesquisei alto e baixo para métodos de compilação .cu no Visual Studio, mas sem sucesso Código que tentei ...
Padrão C ++ 11 com CUDA 6.0
Eu quero usar o padrão C ++ 11 para meus arquivos C ++ no meu projeto CUDA 6.0. Quando altero o compilador nas configurações do CUDA 6.0 Nsight Eclipse para g ++ e adiciono o-std=c++11 opção, então eu recebo muitos erros como este: error: ...
cudaMemcpyFromSymbol em uma variável __device__
Estou tentando aplicar uma função do kernel em um__device__ variável, que, de acordo com as especificações, reside "na memória global" #include <stdio.h> #include "sys_data.h" #include "my_helper.cuh" #include "helper_cuda.h" #include ...
Por que o GK110 possui 192 núcleos e 4 warps?
Eu queria ter uma idéia da arquitetura de Kepler, mas isso não faz sentido para mim. Se um warp tiver 32 threads, e 4 deles forem agendados / executados, isso significa que 128 núcleos estão em uso e 64 ficam ociosos. No whitepaper, dizia algo ...
Inconsistência de IDs entre 'nvidia-smi -L' e cuDeviceGetName ()
Estou executando este comando em um shell e recebo: C:\Users\me>nvidia-smi -L GPU 0: Quadro K2000 (UUID: GPU-b1ac50d1-019c-58e1-3598-4877fddd3f17) GPU 1: Quadro 2000 (UUID: GPU-1f22a253-c329-dfb7-0db4-e005efb6a4c7)Mas no meu código, quando ...
CUDA Demasiados recursos solicitados para lançamento
Estou com alguns problemas ao executar meu código em uma GTX 480 com Compute Capability 2.0 Eu sempre recebo o seguinte erro se eu iniciar o kernel com 1024 threads por bloco: ========= CUDA-MEMCHECK ========= Program hit ...
'Code = sm_X' incorpora apenas código binário (cubin), ou também código PTX, ou ambos?
Estou um pouco confuso sobre a opção 'code = sm_X' na instrução '-gencode'. Um exemplo: O que a opção do compilador NVCC -gencode arch=compute_13,code=sm_13incorporar na biblioteca? Somente o código da máquina (código do cubin) para GPUs com ...
Multiplicação matriz-vetor em CUDA: benchmarking & performance
Estou atualizando minha pergunta com alguns novos resultados de benchmarking (também reformulei a pergunta para ser mais específica e atualizei o código) ... Eu implementei um kernel para multiplicação de vetores matriciais no CUDA C, seguindo ...
OpenCL ou CUDA Qual o caminho a seguir?
Estou investigando maneiras de usar a GPU para processar dados de streaming. Eu tinha duas opções, mas não conseguia decidir qual caminho seguir? Meus critérios são os seguintes: Facilidade de uso (boa API)Comunidade e ...