Resultados da pesquisa a pedido "cuda"
Compilando CUDA com clang
Eu sou novo no LLVM. Ouvi dizer que o clang suporta CUDA. Como faço para compilar o CUDA usando o clang? Eu tenho que fazer algumas alterações de configuraçã...
Como faço para escolher uma CPU e uma GPU para uma comparação justa? [fechadas]
Eu preciso fazer um argumento persuasivo de que uma boa GPU seria valiosa para alguém que precisa fazer certos cálculos e pode estar disposto a escrever seu ...
Como um kernel CUDA é lançado?
Eu criei um aplicativo CUDA simples para adicionar duas matrizes. Está compilando bem. Eu quero saber como o kernel será lançado por todos os threads e qual ...
Convertendo thrust :: iterators de e para ponteiros brutos
Eu quero usar a biblioteca Thrust para calcular a soma de prefixo da matriz de dispositivos em CUDA. Minha matriz é alocada com
Como os blocos simultâneos podem executar um único multiprocessador de streaming de GPU?
Eu estava estudando sobre a estrutura de programação CUDA e o que eu senti depois de estudar é isso; depois de criar os blocos e encadeamentos, cada um desse...
Forçando o CUDA a usar o registrador para uma variável
Eu tenho muitos registradores não utilizados no meu kernel. Eu gostaria de dizer ao CUDA para usar alguns registradores para armazenar alguns dados, ao invés...
Copiar para memória global alocada por malloc ()?
O guia de programação CUDA afirma que "Memória alocada via
programa falha para matriz 30 x 30
Este é um programa para multiplicação de matrizes na arquitetura CUDA. Este código está funcionando bem quando o tamanho da matriz é 30 x 30, mas dando saída...