Resultados da pesquisa a pedido "gpu-programming"

1 a resposta

Como usar o recurso de grupos cooperativos do CUDA no Windows

@My GPU é GeForce MX150, arquitetura pascal, CC. 6.1, CUDA 9.1, windows 10. Embora minha GPU seja pascal, mas grupos cooperativos não funcionam. Quero usá-lo para sincronização entre blocos. Descobri que meu modo tcc não está ativ ambém descobri ...

1 a resposta

desempenho de cudaMemcpyToSymbol

Eu tenho algumas funções que carregam uma variável na memória constante do dispositivo e iniciam uma função do kernel. Percebi que a primeira vez que uma função carrega uma variável na memória constante leva 0,6 segundos, mas as próximas cargas ...

1 a resposta

nvidia-smi Explicação volátil da utilização de GPU?

Eu sei dissonvidia-smi -l 1 fornecerá o uso da GPU a cada segundo (da mesma forma que o seguinte). Gostaria, no entanto, de uma explicação sobre o queVolatile GPU-Util realmente significa. Esse é o número de SMs usadas sobre o total de SMs, a ...

2 a resposta

O que é memória coerente na GPU?

Tropecei nem uma vez em um termo memória "não coerente" e "coerente" no papéis de tecnologia [https://renderdoc.org/vulkan-in-30-minutes.html]Eu tenho procurado por uma explicação simples e clara, mas encontrei artigos principalmente 'hardcore' ...

3 a resposta

Como determinar o tamanho máximo do lote para um modelo de treinamento RNN seq2seq tensorflow

Atualmente, estou usando o 64 padrão como o tamanho do lote para o modelo de fluxo tensor seq2seq. Qual é o tamanho máximo do lote, o tamanho da camada, etc. Posso usar uma única GPU Titan X com 12 GB de RAM e Haswell-E xeon 128 GB de RAM. Os ...

2 a resposta

Como interromper ou cancelar um kernel CUDA do código do host

Estou trabalhando com a CUDA e estou tentando interromper o trabalho dos meus kernels (ou seja, encerrar todos os threads em execução) após um certo períodoif bloco está sendo atingido. Como eu posso fazer isso? Eu estou realmente preso aqui.

1 a resposta

Otimização de GPU para código vetorizado

function w=oja(X, varargin) % get the dimensionality [m n] = size(X); % random initial weights w = randn(m,1); options = struct( ... 'rate', .00005, ... 'niter', 5000, ... 'delta', .0001); options = getopt(options, varargin); success = 0; % run ...

2 a resposta

por que o MATLAB gpuarray é muito mais lento ao adicionar apenas duas matrizes?

Recentemente, empreguei a biblioteca MATLAB CUDA para alguns cálculos de matriz absolutamente simples na gpu. Mas os resultados do desempenho são muito estranhos. Alguém poderia me ajudar a entender exatamente o que está acontecendo e como posso ...

2 a resposta

Usando Java com GPUs da Nvidia (cuda)

Estou trabalhando em um projeto de negócios que é feito em java e precisa de um enorme poder de computação para calcular os mercados de negócios. Matemática simples, mas com enorme quantidade de dados. Pedimos alguns cuda gpu para experimentá-lo ...

2 a resposta

Código OpenCL 'Erro MSB3721' para Intel OpenCL SDK no Visual Studio 2010

Atualmente, estou usando a plataforma OpenCL SDK da Intel para programação paralela heterogênea (OpenCL). Estou usando o Visual Studio 2010 Ultimate para isso. Meu sistema não possui nenhuma GPU. Eu trabalhei na plataforma CUDA SDK para ...