Resultados da pesquisa a pedido "cuda"

1 a resposta

Um contexto CUDA foi criado em uma GPU que não está atualmente depurável

Quando inicio a depuração cuda, o Nsight retorna este erro: Um contexto CUDA foi criado em uma GPU que não é atualmente depurável. Os pontos de interrupção serão desativados. Adaptador: GeForce GT 720M Esta é a minha informação do sistema e da ...

1 a resposta

cuda aplicação simples trabalhando para 32 bits não para 64 bits

Meu aplicativo simples cuda helloworld funciona bem quando construído em 32 bits usando a comunidade do visual studio 2015 no Windows 10. No entanto, se eu construí-lo em 64 bits, ele não será executado GPU: Telsa K40c ToolKit: CUDA 8 Sistema ...

2 a resposta

Quais são os valores padrão para as opções de arco e código ao usar o nvcc?

Ao compilar seu código CUDA, você deve selecionar para qual arquitetura seu código está sendo gerado.nvcc fornece dois parâmetros para especificar essa arquitetura, basicamente: arch especifica a arquitetura virtual, que pode sercompute_10, ...

1 a resposta

Iterando através de uma matriz 2D em PyCUDA

Estou tentando iterar através de uma matriz 2D em PyCUDA, mas acabo com valores de matriz repetidos. Inicialmente, lanço uma matriz inteira aleatória pequena e isso funciona conforme o esperado, mas quando lanço uma imagem nela, vejo os mesmos ...

2 a resposta

A inicialização de um encadeamento por elemento sempre é ideal para problemas independentes de dados na GPU?

Eu estava escrevendo um kernel memcpy simples para medir a largura de banda de memória do meu GTX 760M e compará-lo com cudaMemcpy (). Parece que: template<unsigned int THREADS_PER_BLOCK> __global__ static void copy(void* src, void* dest, ...

2 a resposta

Processamento de vídeo acelerado por GPU com ffmpeg

Quero usar o ffmpeg para acelerar a codificação e decodificação de vídeo com uma GPU NVIDIA. DeSite da NVIDIA [https://developer.nvidia.com/nvidia-video-codec-sdk]: As GPUs NVIDIA contêm um ou mais decodificadores e codificadores baseados ...

1 a resposta

Registrando a memória do dispositivo de caracteres mapeados do Linux com o cudaHostRegister Results em argumento inválido

Estou tentando aumentar a transferência de dados da DMA <-> CPU <-> GPU da seguinte forma: 1. Mapeando meu dispositivo (proprietário) O Kernel Linux alocou memória para o espaço do usuário 2. Registrando a memória posterior (memória mapeada) no ...

4 a resposta

CUDA determinando threads por bloco, blocos por grade

Eu sou novo no paradigma CUDA. Minha pergunta é determinar o número de threads por bloco e blocos por grade. Um pouco de arte e julgamento contribuem para isso? O que eu descobri é que muitos exemplos têm números aparentemente arbitrários ...

1 a resposta

Usando cuBLAS com números complexos da Thrust

No meu código, uso matrizes com números complexos da biblioteca de empuxo e gostaria de usar cublasZgeam () para transpor a matriz. Usar números complexos do cuComplex.h não é uma opção preferível, pois faço muita aritmética na matriz e o ...

1 a resposta

CUDA C ++: Esperava uma expressão no arquivo kernel.cu

Comecei a aprender um pouco de CUDA e encontrei esse erro na linha a seguir, em uma expressão <<< >>> #include "kernels.h" #include "helpers.h" #include <iostream> #include <cmath> #include <cuda_runtime.h> #include <device_launch_parameters.h> ...