Resultados da pesquisa a pedido "gpgpu"

3 a resposta

Quantos 'núcleos CUDA' possui cada multiprocessador de uma GPU?

Eu sei que os dispositivos anteriores à arquitetura Fermi tinham 8 SPs em um único multiprocessador. A contagem é a mesma na arquitetura Fermi?

1 a resposta

O código Thrust simples executa cerca da metade da velocidade do meu kernel cuda ingênuo. Estou usando o Thrust errado?

Eu sou muito novo no Cuda e no Thrust, mas minha impressão foi que o Thrust, quando usado bem, deveria oferecer um desempenho melhor do que os kernels do Cuda escritos de forma ingênua. Estou usando o Thrust de maneira abaixo do ideal? Abaixo ...

2 a resposta

Passagem da função host como um ponteiro de função na função __global__ OR __device__ na CUDA

Atualmente, estou desenvolvendo uma versão GPU de uma função da CPU (por exemplo, a função Calc (int a, int b, double * c, splic * d, CalcInvFunction GetInv)), na qual uma função host é passada como ponteiro de função (por exemplo, acima) exemplo ...

1 a resposta

Executando mais de um aplicativo CUDA em uma GPU

O documento CUDA não especifica quantos processos CUDA podem compartilhar uma GPU. Por exemplo, se eu iniciar mais de um programa CUDA pelo mesmo usuário com apenas uma placa GPU instalada no sistema, qual é o efeito? Isso garantirá a correção da ...

3 a resposta

Existe um limite para a memória local do OpenCL?

Hoje eu adicionei mais quatro__local variáveis ao meu kernel para despejar resultados intermediários. Mas apenas adicionar as quatro variáveis à assinatura do kernel e adicionar os argumentos correspondentes do kernel renderiza toda a saída do ...

1 a resposta

Como uso o MPS (Nvidia Multi-Process Service) para executar vários aplicativos CUDA não MPI?

Posso executar aplicativos CUDA não MPI simultaneamente nas GPUs NVIDIA Kepler com MPS? Eu gostaria de fazer isso porque meus aplicativos não podem utilizar totalmente a GPU, por isso quero que eles co-executem juntos. Existe algum exemplo de ...

2 a resposta

O que é memória coerente na GPU?

Tropecei nem uma vez em um termo memória "não coerente" e "coerente" no papéis de tecnologia [https://renderdoc.org/vulkan-in-30-minutes.html]Eu tenho procurado por uma explicação simples e clara, mas encontrei artigos principalmente 'hardcore' ...

3 a resposta

Em um shader de fragmento GLSL, como acessar o texel em um nível específico do mipmap?

Estou usando o OpenGL para fazer alguns cálculos de GPGPU através da combinação de um shader de vértice e um shader de fragmento. Eu preciso fazer cálculos em uma imagem em escala diferente. Eu gostaria de usar mipmaps, pois sua geração pode ser ...

2 a resposta

Os threads em um warp CUDA são executados em paralelo em um multiprocessado

Um warp tem 32 threads. Os 32 threads são executados em paralelo em um multiprocessador? Se 32 threads não estiverem sendo executados em paralelo, não haverá condição de corrida no warp. Eu tenho essa dúvida depois de analisar alguns exemplo

1 a resposta

Quantos threads (ou itens de trabalho) podem ser executados ao mesmo temp

Sou novo na programação GPGPU e estou trabalhando com a implementação do OpenCL da NVIDI minha pergunta era como calcular o limite de um dispositivo GPU (em número de threads Pelo que entendi, existem vários grupos de trabalho (equivalentes a ...