Resultados da pesquisa a pedido "cuda"

3 a resposta

Como o CudaMalloc funciona?

Estou tentando modificar a classe imageDenosing no CUDA SDK, preciso repetir o filtro muitas vezes para capturar o tempo. Mas meu código não funciona corretamente. //começar __global__ void F1D(TColor *image,int imageW,int imageH, TColor ...

2 a resposta

Posso alocar memória do dispositivo usando o OpenCL e usar ponteiros para a memória no CUDA?

Digamos que eu use o OpenCL para gerenciar memória (para que o gerenciamento de memória entre GPU / CPU use o mesmo código), mas meu cálculo use código CUDA e CPU otimizado (não OpenCL). Ainda posso usar os ponteiros de memória do dispositivo ...

4 a resposta

Erro de vinculação CUDA - Visual Express 2008 - nvcc fatal devido ao arquivo de configuração (nulo)

Eu tenho pesquisado extensivamente por uma possível solução para o meu erro nas últimas 2 semanas. Instalei com êxito o compilador Cuda de 64 bits (ferramentas) e o SDK, bem como a versão de 64 bits do Visual Studio Express 2008 e Windows 7 SDK ...

1 a resposta

Classificando vértices compactados com empuxo

Então, eu tenho uma matriz de dispositivos de estruturas PackedVertex: struct PackedVertex { glm::vec3 Vertex; glm::vec2 UV; glm::vec3 Normal; }Estou tentando classificá-los para que as duplicatas sejam agrupadas na matriz; Eu não me importo com ...

1 a resposta

A função getrs do cuSolver sobre pycuda não funciona corretamente

Estou tentando criar um invólucro pycuda inspirado na biblioteca scikits-cuda para algumas operações fornecidas na nova biblioteca cuSolver da Nvidia. Quero resolver um sistema linear do formato AX = B por fatoração LU, para executar esse ...

1 a resposta

CUDA: Evitando execução serial na divergência de ramificação

Suponha que um núcleo CUDA executado por um único warp (por simplicidade) atinja umif-else declaração, onde 20 dos threads dentro do warp satisfazemcondition e 32 - 20 = 12 threads não: if (condition){ statement1; // executed by 20 threads else{ ...

1 a resposta

Número mínimo / máximo inteiro em CUDA

Eu vejo noAPI matemática CUDA [http://docs.nvidia.com/cuda/cuda-math-api/group__CUDA__MATH__SINGLE.html#group__CUDA__MATH__SINGLE_1gef4476ab1d2818b60097fdc4064a395a] documentação de que existem funções para operações min / max de precisão única ...

4 a resposta

CUDA: agrupando a alocação de memória do dispositivo em C ++

Estou começando a usar o CUDA no momento e tenho que admitir que estou um pouco decepcionado com a API C. Entendo os motivos da escolha C, mas, se a linguagem tivesse sido baseada em C ++, vários aspectos seriam muito mais simples, por exemplo, ...

1 a resposta

O Nvidia Cuda warp Scheduler produz?

Eu passeiGuia de programação Cuda [http://developer.download.nvidia.com/compute/cuda/3_2_prod/toolkit/docs/CUDA_C_Programming_Guide.pdf] mas ainda não está claro se uma urdidura cederá em favor de outra urdidura pronta para executar? Alguma ...

1 a resposta

Modelo __host__ __device__ chamando funções definidas pelo host

Durante a implementação do código CUDA, geralmente preciso de algumas funções utilitárias, que serão chamadas do dispositivo e também do código do host. Então eu declaro essas funções como__host__ __device__. Isso está OK e as ...