Resultados da pesquisa a pedido "cuda"

1 a resposta

CUDA Opção de configuração X interativa do Visual Profiler?

Recebo o seguinte aviso ao iniciar um aplicativo no computeprof no Ubuntu 11.04: Os contadores selecionados "instruções gld 8bit", "instruções gld 16bit", "instruções gld 32bit", "instruções gld 64bit", "instruções gld 128bit", "instruções gst ...

1 a resposta

limite @CUDA parece ter sido alcançado, mas que limite é ess

Eu tenho um programa CUDA que parece estar atingindo algum tipo de limite de algum recurso, mas não consigo descobrir qual é esse recurso. Aqui está a função do kernel: __global__ void DoCheck(float2* points, int* segmentToPolylineIndexMap, ...

2 a resposta

Cache L2 na NVIDIA Fermi

Ao olhar o nome dos contadores de desempenho na arquitetura NVIDIA Fermi (o arquivo Compute_profiler.txt na pasta doc do cuda), notei que, para erros de cache L2, existem dois contadores de desempenho, l2_subp0_read_sector_misses ...

2 a resposta

CUDA e Classes

Pesquisei por toda parte algumas dicas sobre como exatamente usar as aulas com o CUDA e, embora exista um consenso geral de que isso pode ser feito e aparentemente esteja sendo feito por pessoas, tive dificuldade em descobrir como realmente faça ...

1 a resposta

NVIDIA Cuda erro "todos os dispositivos compatíveis com CUDA estão ocupados ou indisponíveis" no OSX

Frequentemente, faço com que a biblioteca CUDA falhe completamente e retorne com um erro 46 ("todos os dispositivos compatíveis com CUDA estão ocupados ou indisponíveis"), mesmo para chamadas simples, como cudaMalloc. O código será executado com ...

1 a resposta

Por que CUDA Profiler indica instruções de reprodução: 82%! = Reprodução global + reprodução local + reprodução compartilhada?

Recebi informações do CUDA Profiler. Estou tão confuso por que razão Replays Instruction! = Reprodução de memória global + Reprodução de memória local + Reprodução de conflito bancário compartilhado? Veja as seguintes informações que obtive do ...

2 a resposta

CUDA: chamando a função de biblioteca no kernel

Sei que existe a restrição de ligar apenas__device__ funções no kernel. Isso me impede de chamar funções padrão comostrcmp() e assim por diante no kerne Neste ponto, não consigo entender / encontrar os motivos disso. Não foi possível ao ...

2 a resposta

mplementação de tabela hash para GPU [fechada]

Estou procurando uma implementação de tabela de hash que eu possa usar para codificação CUDA. existe alguém bom lá fora? Algo como o dicionário Python. Vou usar strings como minhas chaves

1 a resposta

Eficiência da função Malloc na CUDA

Estou tentando portar alguns códigos da CPU para o CUDA. Meu cartão CUDA é baseado na arquitetura Fermi e, portanto, posso usar a função malloc () no dispositivo para alocar dinamicamente a memória e não precisar alterar muito os códigos ...

1 a resposta

OpenCV CUDA executando mais lentamente que a CPU OpenCV

Estou lutando para que o OpenCV CUDA melhore o desempenho de coisas como corroer / dilatar, diferenciar quadros etc. quando leio um vídeo de um arquivo avi. típico, recebo metade do FPS na GPU (580gtx) do que na CPU (AMD 955BE). Antes de você ...