Resultados da pesquisa a pedido "cuda"

1 a resposta

O alinhamento da estrutura CUDA está diminuindo a velocidade do meu código (exemplo compilável)

Eu tenho uma simulação que calcula os vetores 3D de partículas carregadas que se deslocam em um campo elétrico e magnético.Tentei acelerar isso no CUDA usando o__align__ especificador, pensando que talvez o fator limitante fosse a leitura e a ...

1 a resposta

O carregamento de vários módulos no JCuda não está funcionando

No jCuda, é possível carregar arquivos cuda no formato PTX ou CUBIN e chamar (iniciar)__global__ funções (kernels) do Java. Com isso em mente, quero desenvolver uma estrutura com o JCuda que obtenha os__device__ função em um.cu arquivo em tempo ...

3 a resposta

Como posso obter o número de núcleos no dispositivo cuda?

Estou procurando uma função que conte o número de núcleos do meu dispositivo cuda. Eu sei que cada microprocessador tem núcleos específicos e meu dispositivo cuda possui 2 microprocessadores. Pesquisei bastante para encontrar uma função de ...

1 a resposta

JIT no JCuda, carregando vários módulos ptx

Eu disse emesta [https://stackoverflow.com/questions/32502375/loading-multiple-modules-in-jcuda-is-not-working] questão de ter tido algum problema ao carregar os módulos ptx no JCuda e, após a idéia do @ talonmies, implementei uma versão JCuda de ...

2 a resposta

Como observar eventos e métricas CUDA para uma subseção de um executável (por exemplo, apenas durante o tempo de execução do kernel)?

Estou familiarizado com o uso do nvprof para acessar os eventos e métricas de uma referência, por exemplo, nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarknameo system-profiling on ...

1 a resposta

CUDA HOME na instalação do pytorch

Instalei o pytorch via conda com cuda 7.5 conda install pytorch=0.3.0 cuda75 -c pytorch >>> import torch >>> torch.cuda.is_available() TrueEu não fiz outras instalações para o cuda além disso, pois parece que o pytorch vem com o cuda Agora, ...

1 a resposta

Alguém pode fornecer código de exemplo demonstrando o uso do ponto flutuante de 16 bits no cuda?

O Cuda 7.5 suporta variáveis de ponto flutuante de 16 bits. Alguém pode fornecer código de exemplo demonstrando o uso dele?

1 a resposta

Como explico a variabilidade de desempenho no barramento PCIe?

No meu programa CUDA, vejo grande variabilidade entre diferentes execuções (até 50%) no tempo de comunicação, que incluem tempos de transferência de dados de host para dispositivo e dispositivo para host através do PCI Express para memória ...

2 a resposta

Ponteiros em estruturas passadas para CUDA

Estou brincando com isso há um tempo agora, mas parece que não estou conseguindo acertar. Estou tentando copiar objetos que contêm matrizes na memória do dispositivo CUDA (e vice-versa, mas vou atravessar essa ponte quando chegar a ele): struct ...

1 a resposta

aplicação da função cuda elementwise em cuda

Depois de multiplicar uma matriz A e um vetor x obtendo o resultado y, quero aplicar uma função h elementwise a y. Eu quero obter z = h (Ax), onde h é aplicado elementarmente ao vetor Ax. Eu sei como fazer a multiplicação de matrizes / vetores ...