Suchergebnisse für Anfrage "cublas"
Cuda: Least-Square-Lösung, geringe Geschwindigkeit
Kürzlich habe ich Cuda benutzt, um einen Algorithmus namens 'Orthogonal Matching Pursuit' zu schreiben. In meinem hässlichen Cuda-Code dauert die gesamte Iteration 60 Sekunden und Eigen lib nur 3 Sekunden ... In meiner Codematrix A ist ...
Umwandlung von Octave in CuBLAS
Ich möchte Octave konvertieren, um CuBLAS für die Matrixmultiplikation zu verwenden. In diesem Video scheint es so einfach zu sein, 28 Zeichen einzugeben:Ver...
Matrix-Vektor-Multiplikation in CUDA: Benchmarking & Performance
Ich aktualisiere meine Frage mit einigen neuen Benchmarking-Ergebnissen (ich habe die Frage auch genauer umformuliert und den Code aktualisiert) ... Ich habe einen Kernel für die Matrix-Vektor-Multiplikation in CUDA C nach dem ...
Entspricht cudaGetErrorString für cuBLAS?
CUDA Runtime hat eine Komfortfunktion
Wie kann man Matrixspalten in CUDA mit maximaler Leistung normalisieren?
Wie kann man Matrixspalten in CUDA effektiv normalisieren?Meine Matrix ist in Spalte-Dur gespeichert und die typische Größe beträgt 2000x200.Die Operation ka...
Finden Sie max / min in CUDA, ohne es an die CPU weiterzuleiten
Ich muss den Index des maximalen Elements in einem Array von Floats finden. Ich benutze die Funktion "cublasIsamax", aber dies gibt den Index an di...
Transponieren Sie die Matrixmultiplikation in cuBLAS howto
Das Problem ist einfach: Ich habe zwei Matrizen, A und B, die M von N sind, wobei M >> N. Ich möchte zuerst die Transponierte von A nehmen und diese da...
Segmentierungsfehler beim Übergeben des Gerätezeigers an cublasSnrm2
Der folgende Code von cublas gibt uns die Fehler: core dumped während "cublasSnrm2 (handle, row, dy, incy, de)", könnten Sie einen Rat geben? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" #include "helper_cuda.h" using ...
Seite 1 von 2