Resultados da pesquisa a pedido "cublas"
As funções do kernel do cublas serão automaticamente sincronizadas com o host?
Apenas uma pergunta geral sobre cublas. Para um único encadeamento, se não houver transferência de memória da GPU para a CPU (por exemplo, cublasGetVector), ...
Cuda: resolução menos quadrada, baixa velocidade
Recentemente, eu uso o Cuda para escrever um algoritmo chamado 'busca de correspondência ortogonal'. No meu feio código Cuda, a iteração inteira leva 60 segundos, e a Eigen lib leva apenas 3 segundos ... No meu código, a matriz A é [640,1024] e ...
CUBLAS: inversão incorreta para matriz com pivô zero
Desde CUDA 5.5, a biblioteca CUBLAS contém rotinas para fatoração e inversão de matrizes em lote ...
Falha na segmentação ao passar o ponteiro do dispositivo para cublasSnrm2
O código de cublas abaixo nos dá os erros: núcleo despejado enquanto estiver em "cublasSnrm2 (identificador, linha, dy, incy, de)", você poderia dar alguns conselhos? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" ...
thrust :: max_element slow na comparação cublasIsamax - Implementação mais eficiente?
Preciso de uma implementação rápida e eficiente para encontrar o índice do valor máximo em uma matriz no CUDA. Esta operação precisa ser realizada várias vezes. Eu originalmente usei cublasIsamax para isso, no entanto, infelizmente, ele retorna o ...
Copiando matriz de ponteiros para a memória do dispositivo e vice-versa (CUDA)
Estou tentando usarcublas funçãocublasSgemmBatched no meu exemplo de brinquedo. Neste exemplo, primeiro aloco matrizes 2D:h_AA, h_BB do tamanho [6] [5] eh_CC do tamanho [6] [1] Depois copiei para o dispositivo, executeicublasSgemmBatched e tentou ...
Usando cuBLAS com números complexos da Thrust
No meu código, uso matrizes com números complexos da biblioteca de empuxo e gostaria de usar cublasZgeam () para transpor a matriz. Usar números complexos do cuComplex.h não é uma opção preferível, pois faço muita aritmética na matriz e o ...
Página 1 do 2