Resultados da pesquisa a pedido "cublas"

1 a resposta

Usando cuBLAS com números complexos da Thrust

No meu código, uso matrizes com números complexos da biblioteca de empuxo e gostaria de usar cublasZgeam () para transpor a matriz. Usar números complexos do cuComplex.h não é uma opção preferível, pois faço muita aritmética na matriz e o ...

1 a resposta

Copiando matriz de ponteiros para a memória do dispositivo e vice-versa (CUDA)

Estou tentando usarcublas funçãocublasSgemmBatched no meu exemplo de brinquedo. Neste exemplo, primeiro aloco matrizes 2D:h_AA, h_BB do tamanho [6] [5] eh_CC do tamanho [6] [1] Depois copiei para o dispositivo, executeicublasSgemmBatched e tentou ...

1 a resposta

thrust :: max_element slow na comparação cublasIsamax - Implementação mais eficiente?

Preciso de uma implementação rápida e eficiente para encontrar o índice do valor máximo em uma matriz no CUDA. Esta operação precisa ser realizada várias vezes. Eu originalmente usei cublasIsamax para isso, no entanto, infelizmente, ele retorna o ...

2 a resposta

Multiplicação matriz-vetor em CUDA: benchmarking & performance

Estou atualizando minha pergunta com alguns novos resultados de benchmarking (também reformulei a pergunta para ser mais específica e atualizei o código) ... Eu implementei um kernel para multiplicação de vetores matriciais no CUDA C, seguindo ...

1 a resposta

Falha na segmentação ao passar o ponteiro do dispositivo para cublasSnrm2

O código de cublas abaixo nos dá os erros: núcleo despejado enquanto estiver em "cublasSnrm2 (identificador, linha, dy, incy, de)", você poderia dar alguns conselhos? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" ...

1 a resposta

CUBLAS: inversão incorreta para matriz com pivô zero

Desde CUDA 5.5, a biblioteca CUBLAS contém rotinas para fatoração e inversão de matrizes em lote ...

1 a resposta

Cuda: resolução menos quadrada, baixa velocidade

Recentemente, eu uso o Cuda para escrever um algoritmo chamado 'busca de correspondência ortogonal'. No meu feio código Cuda, a iteração inteira leva 60 segundos, e a Eigen lib leva apenas 3 segundos ... No meu código, a matriz A é [640,1024] e ...

1 a resposta

Chame cublas em um kernel

2 a resposta

Encontre max / min em CUDA sem passá-lo para a CPU

Eu preciso encontrar o índice do elemento máximo em uma matriz de carros alegóricos. Eu estou usando a função &quot;cublasIsamax&quot;, mas isso retorna o ín...

3 a resposta

Convertendo Octave para Uso de CuBLAS