Resultados da pesquisa a pedido "cuda"

4 a resposta

Ponto flutuante de precisão dupla em CUDA

O CUDA suporta números de ponto flutuante de precisão dupla? Além disso, quais são as razões para o mesmo?

2 a resposta

Matlab / CUDA: simulação de ondas oceânicas

Eu estudei"Simulando a água do oceano" [http://graphics.ucsd.edu/courses/rendering/2005/jdewall/tessendorf.pdf]artigo de Jerry Tessendorf e tentei programar o modelo de onda estatística, mas não obtive o resultado correto e não entendo o ...

2 a resposta

cmake: Definições de pré-processador específicas de destino para destinos CUDA parecem não funcionar

Estou usando o cmake 2.8.1 no Mac OSX 10.6 com CUDA 3.0. Então, eu adicionei um destino CUDA que precisa de BLOCK_SIZE definido para algum número para compilar. cuda_add_executable(SimpleTestsCUDA SimpleTests.cu BlockMatrix.cpp Matrix.cpp ...

1 a resposta

CUDA: adição de dois números dando resposta errada

Aqui está o programa #include <stdio.h> #include <cuda.h> #include <cuda_runtime.h> #include <device_launch_parameters.h> __global__ void Addition(int *a,int *b,int *c) { *c = *a + *b; } int main() { int a,b,c; int *dev_a,*dev_b,*dev_c; int size ...

1 a resposta

Quantidade de memória local por thread CUDA

Eu li na documentação da NVIDIA ( http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#features-and-technical-specifications [http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#features-and-technical-specifications] , ...

1 a resposta

O CUDA falha ao tentar usar as placas discretas iGPU e Nvidia integradas. Como posso usar a nvidia discreta e a intel gpu integrada (integrada)? [fechadas]

Recentemente, tive problemas para fazer meu pc (ivybridge) usar a placa de vídeo integrada (intel igpu HD4000) para o uso normal da tela, enquanto eu corro o meu CUDAprogramas para cálculos no discreto Nvidia GT 640 que tenho na minha máquina.O ...

1 a resposta

CUDA: Como preencher um vetor de tamanho dinâmico no dispositivo e retornar seu conteúdo para outra função do dispositivo?

Quero saber qual é a técnica adequada para preencher uma matriz de tamanho dinâmico no dispositivo (int * row, no código abaixo) e retornar seu conteúdo, para ser usado por outra função do dispositivo. Com o objetivo de contextualizar a ...

3 a resposta

Quantos 'núcleos CUDA' possui cada multiprocessador de uma GPU?

Eu sei que os dispositivos anteriores à arquitetura Fermi tinham 8 SPs em um único multiprocessador. A contagem é a mesma na arquitetura Fermi?

1 a resposta

O código Thrust simples executa cerca da metade da velocidade do meu kernel cuda ingênuo. Estou usando o Thrust errado?

Eu sou muito novo no Cuda e no Thrust, mas minha impressão foi que o Thrust, quando usado bem, deveria oferecer um desempenho melhor do que os kernels do Cuda escritos de forma ingênua. Estou usando o Thrust de maneira abaixo do ideal? Abaixo ...

1 a resposta

Como implementar loops aninhados no impulso cuda

Atualmente, tenho que executar um loop aninhado da seguinte maneira: for(int i = 0; i < N; i++){ for(int j = i+1; j <= N; j++){ compute(...)//some calculation here } }Eu tentei deixar o primeiro loopCPU e faça o segundo loopGPU. Os resultados ...