Resultados da pesquisa a pedido "cublas"

1 a resposta

As funções do kernel do cublas serão automaticamente sincronizadas com o host?

Apenas uma pergunta geral sobre cublas. Para um único encadeamento, se não houver transferência de memória da GPU para a CPU (por exemplo, cublasGetVector), ...

1 a resposta

cuBLAS argmin - segfault se estiver enviando para a memória do dispositivo?

Em cuBLAS,

1 a resposta

Transpor a multiplicação de matrizes no howO do cuBLAS

1 a resposta

Chame cublas em um kernel

1 a resposta

Cuda: resolução menos quadrada, baixa velocidade

Recentemente, eu uso o Cuda para escrever um algoritmo chamado 'busca de correspondência ortogonal'. No meu feio código Cuda, a iteração inteira leva 60 segundos, e a Eigen lib leva apenas 3 segundos ... No meu código, a matriz A é [640,1024] e ...

1 a resposta

CUBLAS: inversão incorreta para matriz com pivô zero

Desde CUDA 5.5, a biblioteca CUBLAS contém rotinas para fatoração e inversão de matrizes em lote ...

1 a resposta

Falha na segmentação ao passar o ponteiro do dispositivo para cublasSnrm2

O código de cublas abaixo nos dá os erros: núcleo despejado enquanto estiver em "cublasSnrm2 (identificador, linha, dy, incy, de)", você poderia dar alguns conselhos? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" ...

1 a resposta

thrust :: max_element slow na comparação cublasIsamax - Implementação mais eficiente?

Preciso de uma implementação rápida e eficiente para encontrar o índice do valor máximo em uma matriz no CUDA. Esta operação precisa ser realizada várias vezes. Eu originalmente usei cublasIsamax para isso, no entanto, infelizmente, ele retorna o ...

1 a resposta

Copiando matriz de ponteiros para a memória do dispositivo e vice-versa (CUDA)

Estou tentando usarcublas funçãocublasSgemmBatched no meu exemplo de brinquedo. Neste exemplo, primeiro aloco matrizes 2D:h_AA, h_BB do tamanho [6] [5] eh_CC do tamanho [6] [1] Depois copiei para o dispositivo, executeicublasSgemmBatched e tentou ...

1 a resposta

Usando cuBLAS com números complexos da Thrust

No meu código, uso matrizes com números complexos da biblioteca de empuxo e gostaria de usar cublasZgeam () para transpor a matriz. Usar números complexos do cuComplex.h não é uma opção preferível, pois faço muita aritmética na matriz e o ...