Resultados da pesquisa a pedido "cuda"

2 a resposta

PyCUDA + Threading = Alças inválidas em invocações de kernel

Vou tentar deixar isso claro; Eu tenho duas classes;GPU(Object), para acesso geral à funcionalidade da GPU, emultifunc(threading.Thread) para uma função específica, estou tentando multi-dispositivo-ify.GPU contém a maior parte do processamento ...

7 a resposta

rogramação GPU Python [fechada]

tualmente, estou trabalhando em um projeto em python e gostaria de usar a GPU para alguns cálculo À primeira vista, parece que existem muitas ferramentas disponíveis; à segunda vista, sinto que estou perdendo alguma cois Copperhead parece ...

4 a resposta

Erro compilando Cuda - expressão primária esperada

Este programa parece estar bem, mas ainda estou recebendo um erro, alguma sugestão? Programa #include "dot.h" #include <cuda.h> #include <cuda_runtime.h> #include <stdio.h> int main(int argc, char** argv) { int *a, *b, *c; int *dev_a, *dev_b, ...

3 a resposta

CUDA Chamadas externas não suportadas

Estou desenvolvendo um aplicativo CUDA 4.0 em execução em um cartão Fermi. De acordo com as especificações, o Fermi possui o Compute Capability 2.0 e, portanto, deve suportar chamadas de função não embutida Eu compilo todas as classes que tenho ...

1 a resposta

CUDA - memcpy2d - tom errado

Acabei de iniciar a programação CUDA e estava tentando executar o código mostrado abaixo. A idéia é copiar uma matriz bidimensional para o dispositivo, calcular a soma de todos os elementos e recuperar a soma posteriormente (eu sei que esse ...

2 a resposta

CUDA Device To Device transfere caro

Escrevi um código para tentar trocar quadrantes de uma matriz 2D para fins de FFT, armazenados em uma matriz plan int leftover = W-dcW; T *temp; T *topHalf; cudaMalloc((void **)&temp, dcW * sizeof(T)); //swap every row, left and right for(int i ...

2 a resposta

Como posso adicionar duas matrizes 2D (inclinadas) usando aninhados para loop

Eu sou novo no cuda. Eu quero adicionar dois matriz 2D em uma terceira matriz. Eu uso o seguinte código: cudaMallocPitch((void**)&device_a, &pitch, 2*sizeof(int),2); cudaMallocPitch((void**)&device_b, &pitch, ...

2 a resposta

Como os blocos CUDA são divididos em urdiduras?

Se eu iniciar meu kernel com uma grade cujos blocos têm dimensões: dim3 block_dims(16,16);Como os blocos da grade estão agora divididos em urdiduras? As duas primeiras linhas desse bloco formam uma distorção, ou as duas primeiras colunas, ou são ...

2 a resposta

Devo unificar dois kernels semelhantes com uma declaração 'if', arriscando a perda de desempenho?

Eu tenho 2 funções muito semelhantes no kernel, no sentido de que o código é quase o mesmo, mas com uma pequena diferença. Atualmente, tenho 2 opções: screva dois métodos diferentes (mas muito semelhante Escreva um único kernel e coloque os ...

2 a resposta

programa @CUDA faz com que o driver da nvidia falhe

Meu programa CUDA de cálculo de monte carlo pi está causando uma falha no meu driver da nvidia quando excedo cerca de 500 tentativas e 256 blocos completos. Parece estar acontecendo na função do kernel monteCarlo. Qualquer ajuda ...