Resultados da pesquisa a pedido "gpgpu"
cudaMemcpyFromSymbol em uma variável __device__
Estou tentando aplicar uma função do kernel em um__device__ variável, que, de acordo com as especificações, reside "na memória global" #include <stdio.h> #include "sys_data.h" #include "my_helper.cuh" #include "helper_cuda.h" #include ...
Multiplicação matriz-vetor em CUDA: benchmarking & performance
Estou atualizando minha pergunta com alguns novos resultados de benchmarking (também reformulei a pergunta para ser mais específica e atualizei o código) ... Eu implementei um kernel para multiplicação de vetores matriciais no CUDA C, seguindo ...
Erro de kernel do OpenCL no Mac OSx
Eu escrevi um código OpenCL que funciona bem no LINUX, mas está falhando com erros no Mac OSX. Alguém pode me ajudar a identificar por que isso deve ocorrer. O código do kernel é mostrado após o erro. Meu kernel usa o dobro, então eu tenho o ...
Por que devo usar a API do driver CUDA em vez da API do CUDA Runtime?
Por que devo usar a API do driver CUDA e, nesses casos, não posso usar a API CUDA Runtime (que é mais conveniente que a API do driver)?
por que o MATLAB gpuarray é muito mais lento ao adicionar apenas duas matrizes?
Recentemente, empreguei a biblioteca MATLAB CUDA para alguns cálculos de matriz absolutamente simples na gpu. Mas os resultados do desempenho são muito estranhos. Alguém poderia me ajudar a entender exatamente o que está acontecendo e como posso ...
Fastest sort of fixed length 6 int array
Respondendo a outra pergunta do Stack Overflow (este [https://stackoverflow.com/questions/2775774/what-is-the-best-algorithm-for-this-array-comparison-problem/2777202#2777202] ) Encontrei um sub-problema interessante. Qual é a maneira mais rápida ...
O Apache Mesos reconhece núcleos de GPU?
No slide 25 deessa conversa [http://www.slideshare.net/caniszczyk/apache-mesos-at-twitter-texas-linuxfest-2014] pelo chefe do escritório de código aberto do Twitter, o apresentador diz que o Mesos permite rastrear e gerenciar até recursos da GPU ...
Ponto flutuante de precisão dupla em CUDA
O CUDA suporta números de ponto flutuante de precisão dupla? Além disso, quais são as razões para o mesmo?
Como iniciar o kernel OpenCL personalizado no OpenCV (3.0.0) OCL?
Provavelmente estou usando mal o OpenCV usando-o como wrapper para as ligações oficiais do OpenCL C ++, para que eu possa iniciar meus próprios kernels. No entanto, o OpenCV tem classes como Program, ProgramSource, Kernel, Queue etc. que parecem ...
acessando o sistema de arquivos usando o dispositivo cpu no opencl
Eu sou um novato no opencl. Eu tenho uma dúvida sobre o funcionamento do opencl quando o kernel está sendo executado em um dispositivo da CPU. Suponha que tenhamos um kernel executando em um dispositivo da CPU, ele pode ler de um arquivo no ...