Resultados da pesquisa a pedido "cuda"
Ponto flutuante de precisão dupla em CUDA
O CUDA suporta números de ponto flutuante de precisão dupla? Além disso, quais são as razões para o mesmo?
Matlab / CUDA: simulação de ondas oceânicas
Eu estudei"Simulando a água do oceano" [http://graphics.ucsd.edu/courses/rendering/2005/jdewall/tessendorf.pdf]artigo de Jerry Tessendorf e tentei programar o modelo de onda estatística, mas não obtive o resultado correto e não entendo o ...
cmake: Definições de pré-processador específicas de destino para destinos CUDA parecem não funcionar
Estou usando o cmake 2.8.1 no Mac OSX 10.6 com CUDA 3.0. Então, eu adicionei um destino CUDA que precisa de BLOCK_SIZE definido para algum número para compilar. cuda_add_executable(SimpleTestsCUDA SimpleTests.cu BlockMatrix.cpp Matrix.cpp ...
CUDA: adição de dois números dando resposta errada
Aqui está o programa #include <stdio.h> #include <cuda.h> #include <cuda_runtime.h> #include <device_launch_parameters.h> __global__ void Addition(int *a,int *b,int *c) { *c = *a + *b; } int main() { int a,b,c; int *dev_a,*dev_b,*dev_c; int size ...
Quantidade de memória local por thread CUDA
Eu li na documentação da NVIDIA ( http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#features-and-technical-specifications [http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#features-and-technical-specifications] , ...
O CUDA falha ao tentar usar as placas discretas iGPU e Nvidia integradas. Como posso usar a nvidia discreta e a intel gpu integrada (integrada)? [fechadas]
Recentemente, tive problemas para fazer meu pc (ivybridge) usar a placa de vídeo integrada (intel igpu HD4000) para o uso normal da tela, enquanto eu corro o meu CUDAprogramas para cálculos no discreto Nvidia GT 640 que tenho na minha máquina.O ...
CUDA: Como preencher um vetor de tamanho dinâmico no dispositivo e retornar seu conteúdo para outra função do dispositivo?
Quero saber qual é a técnica adequada para preencher uma matriz de tamanho dinâmico no dispositivo (int * row, no código abaixo) e retornar seu conteúdo, para ser usado por outra função do dispositivo. Com o objetivo de contextualizar a ...
Quantos 'núcleos CUDA' possui cada multiprocessador de uma GPU?
Eu sei que os dispositivos anteriores à arquitetura Fermi tinham 8 SPs em um único multiprocessador. A contagem é a mesma na arquitetura Fermi?
O código Thrust simples executa cerca da metade da velocidade do meu kernel cuda ingênuo. Estou usando o Thrust errado?
Eu sou muito novo no Cuda e no Thrust, mas minha impressão foi que o Thrust, quando usado bem, deveria oferecer um desempenho melhor do que os kernels do Cuda escritos de forma ingênua. Estou usando o Thrust de maneira abaixo do ideal? Abaixo ...
Como implementar loops aninhados no impulso cuda
Atualmente, tenho que executar um loop aninhado da seguinte maneira: for(int i = 0; i < N; i++){ for(int j = i+1; j <= N; j++){ compute(...)//some calculation here } }Eu tentei deixar o primeiro loopCPU e faça o segundo loopGPU. Os resultados ...