Suchergebnisse für Anfrage "cublas"

1 die antwort

Cuda: Least-Square-Lösung, geringe Geschwindigkeit

Kürzlich habe ich Cuda benutzt, um einen Algorithmus namens 'Orthogonal Matching Pursuit' zu schreiben. In meinem hässlichen Cuda-Code dauert die gesamte Iteration 60 Sekunden und Eigen lib nur 3 Sekunden ... In meiner Codematrix A ist ...

3 die antwort

Umwandlung von Octave in CuBLAS

Ich möchte Octave konvertieren, um CuBLAS für die Matrixmultiplikation zu verwenden. In diesem Video scheint es so einfach zu sein, 28 Zeichen einzugeben:Ver...

2 die antwort

Matrix-Vektor-Multiplikation in CUDA: Benchmarking & Performance

Ich aktualisiere meine Frage mit einigen neuen Benchmarking-Ergebnissen (ich habe die Frage auch genauer umformuliert und den Code aktualisiert) ... Ich habe einen Kernel für die Matrix-Vektor-Multiplikation in CUDA C nach dem ...

TOP-Veröffentlichungen

2 die antwort

Entspricht cudaGetErrorString für cuBLAS?

CUDA Runtime hat eine Komfortfunktion

3 die antwort

Wie kann man Matrixspalten in CUDA mit maximaler Leistung normalisieren?

Wie kann man Matrixspalten in CUDA effektiv normalisieren?Meine Matrix ist in Spalte-Dur gespeichert und die typische Größe beträgt 2000x200.Die Operation ka...

1 die antwort

cuBLAS argmin - Fehler bei der Ausgabe in den Gerätespeicher?

2 die antwort

Finden Sie max / min in CUDA, ohne es an die CPU weiterzuleiten

Ich muss den Index des maximalen Elements in einem Array von Floats finden. Ich benutze die Funktion "cublasIsamax", aber dies gibt den Index an di...

3 die antwort

Was ist der effizienteste Weg, um eine Matrix in CUDA zu transponieren?

Ich habe ein

1 die antwort

Transponieren Sie die Matrixmultiplikation in cuBLAS howto

Das Problem ist einfach: Ich habe zwei Matrizen, A und B, die M von N sind, wobei M >> N. Ich möchte zuerst die Transponierte von A nehmen und diese da...

1 die antwort

Segmentierungsfehler beim Übergeben des Gerätezeigers an cublasSnrm2

Der folgende Code von cublas gibt uns die Fehler: core dumped während "cublasSnrm2 (handle, row, dy, incy, de)", könnten Sie einen Rat geben? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" #include "helper_cuda.h" using ...