Resultados da pesquisa a pedido "cublas"
Usando cuBLAS com números complexos da Thrust
No meu código, uso matrizes com números complexos da biblioteca de empuxo e gostaria de usar cublasZgeam () para transpor a matriz. Usar números complexos do cuComplex.h não é uma opção preferível, pois faço muita aritmética na matriz e o ...
Copiando matriz de ponteiros para a memória do dispositivo e vice-versa (CUDA)
Estou tentando usarcublas funçãocublasSgemmBatched no meu exemplo de brinquedo. Neste exemplo, primeiro aloco matrizes 2D:h_AA, h_BB do tamanho [6] [5] eh_CC do tamanho [6] [1] Depois copiei para o dispositivo, executeicublasSgemmBatched e tentou ...
thrust :: max_element slow na comparação cublasIsamax - Implementação mais eficiente?
Preciso de uma implementação rápida e eficiente para encontrar o índice do valor máximo em uma matriz no CUDA. Esta operação precisa ser realizada várias vezes. Eu originalmente usei cublasIsamax para isso, no entanto, infelizmente, ele retorna o ...
Multiplicação matriz-vetor em CUDA: benchmarking & performance
Estou atualizando minha pergunta com alguns novos resultados de benchmarking (também reformulei a pergunta para ser mais específica e atualizei o código) ... Eu implementei um kernel para multiplicação de vetores matriciais no CUDA C, seguindo ...
Falha na segmentação ao passar o ponteiro do dispositivo para cublasSnrm2
O código de cublas abaixo nos dá os erros: núcleo despejado enquanto estiver em "cublasSnrm2 (identificador, linha, dy, incy, de)", você poderia dar alguns conselhos? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" ...
CUBLAS: inversão incorreta para matriz com pivô zero
Desde CUDA 5.5, a biblioteca CUBLAS contém rotinas para fatoração e inversão de matrizes em lote ...
Cuda: resolução menos quadrada, baixa velocidade
Recentemente, eu uso o Cuda para escrever um algoritmo chamado 'busca de correspondência ortogonal'. No meu feio código Cuda, a iteração inteira leva 60 segundos, e a Eigen lib leva apenas 3 segundos ... No meu código, a matriz A é [640,1024] e ...
Encontre max / min em CUDA sem passá-lo para a CPU
Eu preciso encontrar o índice do elemento máximo em uma matriz de carros alegóricos. Eu estou usando a função "cublasIsamax", mas isso retorna o ín...
Página 1 do 2