Resultados da pesquisa a pedido "cuda"

3 a resposta

Pesquisar uma matriz ordenada em um kernel CUDA

Estou escrevendo um kernel CUDA e cada thread deve concluir a seguinte tarefa: suponha que eu tenha uma matriz ordenadaa don inteiros não assinados (o primeiro sempre é 0) armazenados na memória compartilhada, cada thread deve encontrar o índice ...

4 a resposta

printf dentro da função CUDA __global__

Atualmente, estou escrevendo uma multiplicação de matrizes em uma GPU e gostaria de depurar meu código, mas como não consigo usar printf dentro de uma função de dispositivo, há algo mais que posso fazer para ver o que está acontecendo ...

7 a resposta

Computando o espaço nulo de uma matriz o mais rápido possível

Preciso calcular o espaço nulo de vários milhares de matrizes pequenas (8x9, não 4x3, como escrevi anteriormente) em paralelo (CUDA). Todas as referências apontam para SVD, mas o algoritmo nas receitas numéricas parece muito caro e me oferece ...

3 a resposta

Compilar código cuda para CPU

Estou estudando cuda 5.5, mas não tenho nenhuma GPU Nvidia. Na versão antiga do nvcc, há uma flag --mticticore para compilar o código cuda para a CPU. Na nova versão do nvcc, qual é a opção ?? Estou trabalhando no Linux.

1 a resposta

MakeFile de paralelismo dinâmico CUDA

Este é o meu primeiro programa usando o Paralelismo Dinâmico e não consigo compilar o código. Preciso executar isso para o meu projeto de pesquisa na faculdade e qualquer ajuda será muito apreciada: Estou tendo o erro a ...

1 a resposta

matriz cuda inversa gaussiana Jordânia

Não encontrei nenhuma pergunta semelhante à minha. Estou tentando escrever o algoritmo de matriz inversa gaussiano-jordan. A ideia do algoritmo é simples :) Eu quero inverter apenas uma matriz triangular inferior. Eu tenho resposta ...

1 a resposta

Como ativar / desativar uma placa gráfica específica?

Estou trabalhando em uma máquina "Fujitsu". Possui 2 GPUs instaladas: Quadro 2000 e Tesla C2075. A GPU Quadro possui 1 GB de RAM e a Tesla GPU possui 5 GB. (Eu verifiquei usando a saída da nvidia-smi -q). Quando executo a nvidia-smi, a saída ...

1 a resposta

cub BlockRadixSort: como lidar com tamanho de bloco grande ou classificar vários blocos?

Ao usar cub :: BlockRadixSort para fazer a classificação dentro de um bloco, se o número de elementos for muito grande, como lidamos com isso? Se definirmos um tamanho de ladrilho muito grande, a memória compartilhada do armazenamento temporário ...

1 a resposta

cudaMalloc de uma estrutura e um elemento da mesma estrutura

Gostaria de saber o que acontece no dispositivo (em memória) quando aloco uma estrutura e depoisalocar (?) e copiarum elemento ponteiro da mesma estrutura. Eu precisocudaMalloc do elemento*umanovamente? Código de exemplo: typedef struct { int ...

1 a resposta

Cuda: resolução menos quadrada, baixa velocidade

Recentemente, eu uso o Cuda para escrever um algoritmo chamado 'busca de correspondência ortogonal'. No meu feio código Cuda, a iteração inteira leva 60 segundos, e a Eigen lib leva apenas 3 segundos ... No meu código, a matriz A é [640,1024] e ...