Resultados da pesquisa a pedido "gpu"

Eu estou fazendo um memcpy assíncrono de gpu0 para gpu1 usando cudaMemcpyPeerAsync ().cudaMemcpyAsync () fornece a opção de fluxo a ser usado para gpu0, mas ...

cuda c c++

2 a resposta

2d matriz char para o kernel CUDA

cuda nvidia caching

1 a resposta

Cache L2 em Kepler

cula c cuda

1 a resposta

As rotinas CULA podem ser chamadas de kernels de dispositivos?

opencl c++parallel-processing

2 a resposta

Meu teste de opencl não roda muito mais rápido que a CPU

Estou tentando medir o tempo de execução da GPU e compará-lo com a CPU. Eu escrevi uma função simple_add para adicionar todos os elementos de um vetor int curto. O código do Kernel é: global const int * A, global const uint * B, global int* C) ...

keras deep-learning

2 a resposta

Posso implementar modelos de aprendizado profundo no meu laptop com gráficos intel hd

Atualmente, estou fazendo um projeto de aprendizagem profunda para meu mestrado. Eu queria instalar a biblioteca keras, então, quando comecei a instalar o Theano e o tensorflow, vi que precisava instalar o CUDA. Mas meu laptop vem com gráficos hd ...

cuda c++class templates

1 a resposta

O erro cudaMemcpy ao copiar do dispositivo para o host após a função de membro da classe device altera o valor da variável do dispositivo

Estou confuso quanto ao comportamento do código CUDA que escrevi. Estou no meio de escrever testes para o meu__device__ funções em uma classe chamadaDimmedGridGPU. Esta classe é modelada em umint DIM e a função com a qual tenho problemas visa ...

gdi java video java-2d

1 a resposta

Hardware acelera desenho de bitmap em java

Quero poder desenhar bitmaps consecutivos (do tipo BufferedImage.TYPE_INT_RGB) de um vídeo o mais rápido possível em java. Eu quero saber o melhor método para fazer isso. Alguém tem algum conselho por onde devo começar? Pelo que li, duas opções ...

tensorflow lstm

0 a resposta

Baixo uso e desempenho da GPU com Tensorflow + RNNs

Eu implementei uma rede que tenta prever uma palavra de uma frase. A rede é realmente bastante complexa, mas aqui está uma versão simples: Pegue índices de palavras em uma frase e converta em incorporaçãoExecute cada frase através do LSTMAtribua ...

tensorflow distributed-system

2 a resposta

Tensorflow em GPUs compartilhadas: como selecionar automaticamente a que não está sendo usada

Eu tenho acesso através do ssh a um cluster de n GPUs. O fluxo de tensão automaticamente deu a eles nomes gpu: 0, ..., gpu: (n-1). Outros também têm acesso e, às vezes, usam gpus aleatórios. Não coloquei nenhumtf.device() explicitamente porque ...

Página 7 do 16

5 678 9

Resultados da pesquisa a pedido "gpu"

Como definir o fluxo de dispositivo de destino em cudaMemcpyPeerAsync ()?

2d matriz char para o kernel CUDA

Cache L2 em Kepler

Tags populares

As rotinas CULA podem ser chamadas de kernels de dispositivos?

Meu teste de opencl não roda muito mais rápido que a CPU

Posso implementar modelos de aprendizado profundo no meu laptop com gráficos intel hd

O erro cudaMemcpy ao copiar do dispositivo para o host após a função de membro da classe device altera o valor da variável do dispositivo

Hardware acelera desenho de bitmap em java

Baixo uso e desempenho da GPU com Tensorflow + RNNs

Tensorflow em GPUs compartilhadas: como selecionar automaticamente a que não está sendo usada

Você é muito ativo! É ótimo!

Resultados da pesquisa a pedido "gpu"

Tags populares