Resultados da pesquisa a pedido "cublas"

2 a resposta

Encontre max / min em CUDA sem passá-lo para a CPU

Eu preciso encontrar o índice do elemento máximo em uma matriz de carros alegóricos. Eu estou usando a função "cublasIsamax", mas isso retorna o ín...

1 a resposta

Chame cublas em um kernel

1 a resposta

Usando cuBLAS com números complexos da Thrust

No meu código, uso matrizes com números complexos da biblioteca de empuxo e gostaria de usar cublasZgeam () para transpor a matriz. Usar números complexos do cuComplex.h não é uma opção preferível, pois faço muita aritmética na matriz e o ...

1 a resposta

Cuda: resolução menos quadrada, baixa velocidade

Recentemente, eu uso o Cuda para escrever um algoritmo chamado 'busca de correspondência ortogonal'. No meu feio código Cuda, a iteração inteira leva 60 segundos, e a Eigen lib leva apenas 3 segundos ... No meu código, a matriz A é [640,1024] e ...

1 a resposta

CUBLAS: inversão incorreta para matriz com pivô zero

Desde CUDA 5.5, a biblioteca CUBLAS contém rotinas para fatoração e inversão de matrizes em lote ...

1 a resposta

Falha na segmentação ao passar o ponteiro do dispositivo para cublasSnrm2

O código de cublas abaixo nos dá os erros: núcleo despejado enquanto estiver em "cublasSnrm2 (identificador, linha, dy, incy, de)", você poderia dar alguns conselhos? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" ...

2 a resposta

Multiplicação matriz-vetor em CUDA: benchmarking & performance

Estou atualizando minha pergunta com alguns novos resultados de benchmarking (também reformulei a pergunta para ser mais específica e atualizei o código) ... Eu implementei um kernel para multiplicação de vetores matriciais no CUDA C, seguindo ...

1 a resposta

thrust :: max_element slow na comparação cublasIsamax - Implementação mais eficiente?

Preciso de uma implementação rápida e eficiente para encontrar o índice do valor máximo em uma matriz no CUDA. Esta operação precisa ser realizada várias vezes. Eu originalmente usei cublasIsamax para isso, no entanto, infelizmente, ele retorna o ...

1 a resposta

Copiando matriz de ponteiros para a memória do dispositivo e vice-versa (CUDA)

Estou tentando usarcublas funçãocublasSgemmBatched no meu exemplo de brinquedo. Neste exemplo, primeiro aloco matrizes 2D:h_AA, h_BB do tamanho [6] [5] eh_CC do tamanho [6] [1] Depois copiei para o dispositivo, executeicublasSgemmBatched e tentou ...

2 a resposta

CUBLAS - adição de matriz .. com

Estou tentando usar CUBLAS para somar duas grandes matrizes de tamanho desconhecido. Eu preciso de um código totalmente otimizado (se possível), portanto optei por não reescrever o código de adição da matriz (simples), mas usando CUBLAS, em ...