Resultados da pesquisa a pedido "gpu-programming"
Como usar o recurso de grupos cooperativos do CUDA no Windows
@My GPU é GeForce MX150, arquitetura pascal, CC. 6.1, CUDA 9.1, windows 10. Embora minha GPU seja pascal, mas grupos cooperativos não funcionam. Quero usá-lo para sincronização entre blocos. Descobri que meu modo tcc não está ativ ambém descobri ...
desempenho de cudaMemcpyToSymbol
Eu tenho algumas funções que carregam uma variável na memória constante do dispositivo e iniciam uma função do kernel. Percebi que a primeira vez que uma função carrega uma variável na memória constante leva 0,6 segundos, mas as próximas cargas ...
nvidia-smi Explicação volátil da utilização de GPU?
Eu sei dissonvidia-smi -l 1 fornecerá o uso da GPU a cada segundo (da mesma forma que o seguinte). Gostaria, no entanto, de uma explicação sobre o queVolatile GPU-Util realmente significa. Esse é o número de SMs usadas sobre o total de SMs, a ...
O que é memória coerente na GPU?
Tropecei nem uma vez em um termo memória "não coerente" e "coerente" no papéis de tecnologia [https://renderdoc.org/vulkan-in-30-minutes.html]Eu tenho procurado por uma explicação simples e clara, mas encontrei artigos principalmente 'hardcore' ...
Como determinar o tamanho máximo do lote para um modelo de treinamento RNN seq2seq tensorflow
Atualmente, estou usando o 64 padrão como o tamanho do lote para o modelo de fluxo tensor seq2seq. Qual é o tamanho máximo do lote, o tamanho da camada, etc. Posso usar uma única GPU Titan X com 12 GB de RAM e Haswell-E xeon 128 GB de RAM. Os ...
Como interromper ou cancelar um kernel CUDA do código do host
Estou trabalhando com a CUDA e estou tentando interromper o trabalho dos meus kernels (ou seja, encerrar todos os threads em execução) após um certo períodoif bloco está sendo atingido. Como eu posso fazer isso? Eu estou realmente preso aqui.
Otimização de GPU para código vetorizado
function w=oja(X, varargin) % get the dimensionality [m n] = size(X); % random initial weights w = randn(m,1); options = struct( ... 'rate', .00005, ... 'niter', 5000, ... 'delta', .0001); options = getopt(options, varargin); success = 0; % run ...
por que o MATLAB gpuarray é muito mais lento ao adicionar apenas duas matrizes?
Recentemente, empreguei a biblioteca MATLAB CUDA para alguns cálculos de matriz absolutamente simples na gpu. Mas os resultados do desempenho são muito estranhos. Alguém poderia me ajudar a entender exatamente o que está acontecendo e como posso ...
Usando Java com GPUs da Nvidia (cuda)
Estou trabalhando em um projeto de negócios que é feito em java e precisa de um enorme poder de computação para calcular os mercados de negócios. Matemática simples, mas com enorme quantidade de dados. Pedimos alguns cuda gpu para experimentá-lo ...
Código OpenCL 'Erro MSB3721' para Intel OpenCL SDK no Visual Studio 2010
Atualmente, estou usando a plataforma OpenCL SDK da Intel para programação paralela heterogênea (OpenCL). Estou usando o Visual Studio 2010 Ultimate para isso. Meu sistema não possui nenhuma GPU. Eu trabalhei na plataforma CUDA SDK para ...
Página 1 do 2