Resultados da pesquisa a pedido "cuda"

1 a resposta

Como explicar a reprodução de instruções no CUDA

Alguém poderia resumir a definição e os motivos dos diferentes tipos de repetições de instruções no CUDA? Eles ...

1 a resposta

CUDA: Como usar -arch e -code e SM vs COMPUTE

Ainda não sei como especificar corretamente as arquiteturas para geração de código ao criar com nvcc. Estou ciente de que há código de máquina e código PTX embutido no meu binário e que isso pode ser controlado através dos comutadores do ...

1 a resposta

CUDA: Copie a matriz 1D da GPU para a matriz 2D no host

int main() { char** hMat,* dArr; hMat = new char*[10]; for (int i=0;i<10;i++) { hMat[i] = new char[10]; } cudaMalloc((void**)&dArr,100); // Copy from dArr to hMat here: }Eu tenho uma matrizdArr na GPU e quero copiá-lo em uma matriz 2DhMat no ...

1 a resposta

Transmitir char * para int * não assinado em CUDA

Eu tenho um tipo definido comotypedef unsigned char uint40[5] e então eu tenho uma matriz de uint40, digamosuint40* payloads Eu estava tentando portar a seguinte função em um kernel CUDA void aSimpleFunction(int M, uint40* data) { for (auto i = ...

1 a resposta

Como igualar o número de ocorrências principais usando CUDA / Thrust

Existe uma maneira eficiente de obter um par classificado de matriz de valor / chave e garantir que cada chave tenha um número igual de elementos usando a biblioteca CUDA Thrust? Por exemplo, suponha que temos o seguinte par de matrizes: ID: 1 ...

1 a resposta

Detectando o kernel ptx da transformação Thrust

Eu tenho a seguinte chamada thrust :: transform. my_functor *f_1 = new my_functor(); thrust::transform(data.begin(), data.end(), data.begin(),*f_1);Quero detectar o kernel correspondente no arquivo PTX. Mas existem muitos kernels que contêm ...

2 a resposta

Por que meu kernel CUDA trava (falha de inicialização não especificada) com um tamanho de conjunto de dados diferente?

Eu tenho um núcleo para calcular diferentes elementos de uma matriz, com base em sua posição (diagonal ou fora da diagonal). O kernel funciona como esperado ao calcular matrizes de tamanhos: 14 x 14 (entendo que isso é pequeno e não faz uso ...

1 a resposta

Como vincular uma matriz float * a uma textura 1D em cuda?

Eu estou tentando entender como usar a memória de textura vinculando-a a uma matriz de dispositivo linear (não um cudaArray). Meu código é simples (abaixo). Eu tenho uma matriz float * de 8 números que estou tentando vincular a uma textura 1D e, ...

1 a resposta

Operação simples na estrutura em CUDA: falha de segmentação [duplicado]

Esta pergunta já tem uma resposta aqui: Copiar uma estrutura contendo ponteiros para o dispositivo CUDA [/questions/9309195/copying-a-struct-containing-pointers-to-cuda-device] 3 respostasEsta é a primeira vez que estou implementando estruturas ...

1 a resposta

Sair cedo de um encadeamento interrompe a sincronização entre os encadeamentos CUDA em um bloco? [duplicado

Esta pergunta já tem uma resposta aqui: Posso usar __syncthreads () depois de descartar tópico [/questions/6666382/can-i-use-syncthreads-after-having-dropped-threads] 2 respostas Estou implementando um determinado algoritmo de processamento ...