Resultados da pesquisa a pedido "gpu-programming"
por que o MATLAB gpuarray é muito mais lento ao adicionar apenas duas matrizes?
Recentemente, empreguei a biblioteca MATLAB CUDA para alguns cálculos de matriz absolutamente simples na gpu. Mas os resultados do desempenho são muito estranhos. Alguém poderia me ajudar a entender exatamente o que está acontecendo e como posso ...
Como interromper ou cancelar um kernel CUDA do código do host
Estou trabalhando com a CUDA e estou tentando interromper o trabalho dos meus kernels (ou seja, encerrar todos os threads em execução) após um certo períodoif bloco está sendo atingido. Como eu posso fazer isso? Eu estou realmente preso aqui.
Os aplicativos CUDA atingem o tempo limite e falham após alguns segundos - como contornar isso?
Percebi que os aplicativos CUDA tendem a ter um tempo de execução máximo aproximado de 5 a 15 segundos antes de falhar e sair. Percebo que é ideal não ter o aplicativo CUDA executado por tanto tempo, mas supondo que seja a escolha correta para ...
Usando Java com GPUs da Nvidia (cuda)
Estou trabalhando em um projeto de negócios que é feito em java e precisa de um enorme poder de computação para calcular os mercados de negócios. Matemática simples, mas com enorme quantidade de dados. Pedimos alguns cuda gpu para experimentá-lo ...
printf dentro da função CUDA __global__
Atualmente, estou escrevendo uma multiplicação de matrizes em uma GPU e gostaria de depurar meu código, mas como não consigo usar printf dentro de uma função de dispositivo, há algo mais que posso fazer para ver o que está acontecendo ...
Código OpenCL 'Erro MSB3721' para Intel OpenCL SDK no Visual Studio 2010
Atualmente, estou usando a plataforma OpenCL SDK da Intel para programação paralela heterogênea (OpenCL). Estou usando o Visual Studio 2010 Ultimate para isso. Meu sistema não possui nenhuma GPU. Eu trabalhei na plataforma CUDA SDK para ...
Posso executar o CUDA no processador gráfico integrado da Intel?
Eu tenho um laptop Toshiba muito simples com processador i3. Além disso, eu não tenho nenhuma placa gráfica cara. Nas configurações de exibição, vejoIntel (HD) Gráficos como adaptador de vídeo. Estou planejando aprender alguma programação cuda. ...
Como determinar o tamanho máximo do lote para um modelo de treinamento RNN seq2seq tensorflow
Atualmente, estou usando o 64 padrão como o tamanho do lote para o modelo de fluxo tensor seq2seq. Qual é o tamanho máximo do lote, o tamanho da camada, etc. Posso usar uma única GPU Titan X com 12 GB de RAM e Haswell-E xeon 128 GB de RAM. Os ...
O que é memória coerente na GPU?
Tropecei nem uma vez em um termo memória "não coerente" e "coerente" no papéis de tecnologia [https://renderdoc.org/vulkan-in-30-minutes.html]Eu tenho procurado por uma explicação simples e clara, mas encontrei artigos principalmente 'hardcore' ...
Página 1 do 2