Resultados da pesquisa a pedido "cuda"
CUDA Opção de configuração X interativa do Visual Profiler?
Recebo o seguinte aviso ao iniciar um aplicativo no computeprof no Ubuntu 11.04: Os contadores selecionados "instruções gld 8bit", "instruções gld 16bit", "instruções gld 32bit", "instruções gld 64bit", "instruções gld 128bit", "instruções gst ...
limite @CUDA parece ter sido alcançado, mas que limite é ess
Eu tenho um programa CUDA que parece estar atingindo algum tipo de limite de algum recurso, mas não consigo descobrir qual é esse recurso. Aqui está a função do kernel: __global__ void DoCheck(float2* points, int* segmentToPolylineIndexMap, ...
Cache L2 na NVIDIA Fermi
Ao olhar o nome dos contadores de desempenho na arquitetura NVIDIA Fermi (o arquivo Compute_profiler.txt na pasta doc do cuda), notei que, para erros de cache L2, existem dois contadores de desempenho, l2_subp0_read_sector_misses ...
CUDA e Classes
Pesquisei por toda parte algumas dicas sobre como exatamente usar as aulas com o CUDA e, embora exista um consenso geral de que isso pode ser feito e aparentemente esteja sendo feito por pessoas, tive dificuldade em descobrir como realmente faça ...
NVIDIA Cuda erro "todos os dispositivos compatíveis com CUDA estão ocupados ou indisponíveis" no OSX
Frequentemente, faço com que a biblioteca CUDA falhe completamente e retorne com um erro 46 ("todos os dispositivos compatíveis com CUDA estão ocupados ou indisponíveis"), mesmo para chamadas simples, como cudaMalloc. O código será executado com ...
Por que CUDA Profiler indica instruções de reprodução: 82%! = Reprodução global + reprodução local + reprodução compartilhada?
Recebi informações do CUDA Profiler. Estou tão confuso por que razão Replays Instruction! = Reprodução de memória global + Reprodução de memória local + Reprodução de conflito bancário compartilhado? Veja as seguintes informações que obtive do ...
CUDA: chamando a função de biblioteca no kernel
Sei que existe a restrição de ligar apenas__device__ funções no kernel. Isso me impede de chamar funções padrão comostrcmp() e assim por diante no kerne Neste ponto, não consigo entender / encontrar os motivos disso. Não foi possível ao ...
mplementação de tabela hash para GPU [fechada]
Estou procurando uma implementação de tabela de hash que eu possa usar para codificação CUDA. existe alguém bom lá fora? Algo como o dicionário Python. Vou usar strings como minhas chaves
Eficiência da função Malloc na CUDA
Estou tentando portar alguns códigos da CPU para o CUDA. Meu cartão CUDA é baseado na arquitetura Fermi e, portanto, posso usar a função malloc () no dispositivo para alocar dinamicamente a memória e não precisar alterar muito os códigos ...
OpenCV CUDA executando mais lentamente que a CPU OpenCV
Estou lutando para que o OpenCV CUDA melhore o desempenho de coisas como corroer / dilatar, diferenciar quadros etc. quando leio um vídeo de um arquivo avi. típico, recebo metade do FPS na GPU (580gtx) do que na CPU (AMD 955BE). Antes de você ...