Resultados da pesquisa a pedido "cuda"
PyCUDA + Threading = Alças inválidas em invocações de kernel
Vou tentar deixar isso claro; Eu tenho duas classes;GPU(Object), para acesso geral à funcionalidade da GPU, emultifunc(threading.Thread) para uma função específica, estou tentando multi-dispositivo-ify.GPU contém a maior parte do processamento ...
rogramação GPU Python [fechada]
tualmente, estou trabalhando em um projeto em python e gostaria de usar a GPU para alguns cálculo À primeira vista, parece que existem muitas ferramentas disponíveis; à segunda vista, sinto que estou perdendo alguma cois Copperhead parece ...
Erro compilando Cuda - expressão primária esperada
Este programa parece estar bem, mas ainda estou recebendo um erro, alguma sugestão? Programa #include "dot.h" #include <cuda.h> #include <cuda_runtime.h> #include <stdio.h> int main(int argc, char** argv) { int *a, *b, *c; int *dev_a, *dev_b, ...
CUDA Chamadas externas não suportadas
Estou desenvolvendo um aplicativo CUDA 4.0 em execução em um cartão Fermi. De acordo com as especificações, o Fermi possui o Compute Capability 2.0 e, portanto, deve suportar chamadas de função não embutida Eu compilo todas as classes que tenho ...
CUDA - memcpy2d - tom errado
Acabei de iniciar a programação CUDA e estava tentando executar o código mostrado abaixo. A idéia é copiar uma matriz bidimensional para o dispositivo, calcular a soma de todos os elementos e recuperar a soma posteriormente (eu sei que esse ...
CUDA Device To Device transfere caro
Escrevi um código para tentar trocar quadrantes de uma matriz 2D para fins de FFT, armazenados em uma matriz plan int leftover = W-dcW; T *temp; T *topHalf; cudaMalloc((void **)&temp, dcW * sizeof(T)); //swap every row, left and right for(int i ...
Como posso adicionar duas matrizes 2D (inclinadas) usando aninhados para loop
Eu sou novo no cuda. Eu quero adicionar dois matriz 2D em uma terceira matriz. Eu uso o seguinte código: cudaMallocPitch((void**)&device_a, &pitch, 2*sizeof(int),2); cudaMallocPitch((void**)&device_b, &pitch, ...
Como os blocos CUDA são divididos em urdiduras?
Se eu iniciar meu kernel com uma grade cujos blocos têm dimensões: dim3 block_dims(16,16);Como os blocos da grade estão agora divididos em urdiduras? As duas primeiras linhas desse bloco formam uma distorção, ou as duas primeiras colunas, ou são ...
Devo unificar dois kernels semelhantes com uma declaração 'if', arriscando a perda de desempenho?
Eu tenho 2 funções muito semelhantes no kernel, no sentido de que o código é quase o mesmo, mas com uma pequena diferença. Atualmente, tenho 2 opções: screva dois métodos diferentes (mas muito semelhante Escreva um único kernel e coloque os ...
programa @CUDA faz com que o driver da nvidia falhe
Meu programa CUDA de cálculo de monte carlo pi está causando uma falha no meu driver da nvidia quando excedo cerca de 500 tentativas e 256 blocos completos. Parece estar acontecendo na função do kernel monteCarlo. Qualquer ajuda ...