Resultados da pesquisa a pedido "cuda"
Como explicar a reprodução de instruções no CUDA
Alguém poderia resumir a definição e os motivos dos diferentes tipos de repetições de instruções no CUDA? Eles ...
CUDA: Como usar -arch e -code e SM vs COMPUTE
Ainda não sei como especificar corretamente as arquiteturas para geração de código ao criar com nvcc. Estou ciente de que há código de máquina e código PTX embutido no meu binário e que isso pode ser controlado através dos comutadores do ...
CUDA: Copie a matriz 1D da GPU para a matriz 2D no host
int main() { char** hMat,* dArr; hMat = new char*[10]; for (int i=0;i<10;i++) { hMat[i] = new char[10]; } cudaMalloc((void**)&dArr,100); // Copy from dArr to hMat here: }Eu tenho uma matrizdArr na GPU e quero copiá-lo em uma matriz 2DhMat no ...
Transmitir char * para int * não assinado em CUDA
Eu tenho um tipo definido comotypedef unsigned char uint40[5] e então eu tenho uma matriz de uint40, digamosuint40* payloads Eu estava tentando portar a seguinte função em um kernel CUDA void aSimpleFunction(int M, uint40* data) { for (auto i = ...
Como igualar o número de ocorrências principais usando CUDA / Thrust
Existe uma maneira eficiente de obter um par classificado de matriz de valor / chave e garantir que cada chave tenha um número igual de elementos usando a biblioteca CUDA Thrust? Por exemplo, suponha que temos o seguinte par de matrizes: ID: 1 ...
Detectando o kernel ptx da transformação Thrust
Eu tenho a seguinte chamada thrust :: transform. my_functor *f_1 = new my_functor(); thrust::transform(data.begin(), data.end(), data.begin(),*f_1);Quero detectar o kernel correspondente no arquivo PTX. Mas existem muitos kernels que contêm ...
Por que meu kernel CUDA trava (falha de inicialização não especificada) com um tamanho de conjunto de dados diferente?
Eu tenho um núcleo para calcular diferentes elementos de uma matriz, com base em sua posição (diagonal ou fora da diagonal). O kernel funciona como esperado ao calcular matrizes de tamanhos: 14 x 14 (entendo que isso é pequeno e não faz uso ...
Como vincular uma matriz float * a uma textura 1D em cuda?
Eu estou tentando entender como usar a memória de textura vinculando-a a uma matriz de dispositivo linear (não um cudaArray). Meu código é simples (abaixo). Eu tenho uma matriz float * de 8 números que estou tentando vincular a uma textura 1D e, ...
Operação simples na estrutura em CUDA: falha de segmentação [duplicado]
Esta pergunta já tem uma resposta aqui: Copiar uma estrutura contendo ponteiros para o dispositivo CUDA [/questions/9309195/copying-a-struct-containing-pointers-to-cuda-device] 3 respostasEsta é a primeira vez que estou implementando estruturas ...
Sair cedo de um encadeamento interrompe a sincronização entre os encadeamentos CUDA em um bloco? [duplicado
Esta pergunta já tem uma resposta aqui: Posso usar __syncthreads () depois de descartar tópico [/questions/6666382/can-i-use-syncthreads-after-having-dropped-threads] 2 respostas Estou implementando um determinado algoritmo de processamento ...