Umwandlung von Octave in CuBLAS

Ich möchte Octave konvertieren, um CuBLAS für die Matrixmultiplikation zu verwenden. In diesem Video scheint es so einfach zu sein, 28 Zeichen einzugeben:

Verwenden der CUDA-Bibliothek zur Beschleunigung von Anwendungen

In der Praxis ist es etwas komplexer. Weiß jemand, welche zusätzlichen Arbeiten erforderlich sind, um die in dieser Videokompilierung vorgenommenen Änderungen vorzunehmen?

AKTUALISIEREN

Hier ist die Methode, die ich versuche

in dMatrix.cc hinzufügen

#include <cublas.h>

in dMatrix.cc alle Vorkommen von ändern (Groß- / Kleinschreibung beibehalten)

dgemm

zu

cublas_dgemm

in meinem Build-Terminal-Set

export CC=nvcc
export CFLAGS="-lcublas -lcudart"
export CPPFLAGS="-I/usr/local/cuda/include"
export LDFLAGS="-L/usr/local/cuda/lib64"

Der Fehler, den ich erhalte, ist:

libtool: link: g++ -I/usr/include/freetype2 -Wall -W -Wshadow -Wold-style-cast 
-Wformat -Wpointer-arith -Wwrite-strings -Wcast-align -Wcast-qual -g -O2
-o .libs/octave octave-main.o  -L/usr/local/cuda/lib64 
../libgui/.libs/liboctgui.so ../libinterp/.libs/liboctinterp.so 
../liboctave/.libs/liboctave.so -lutil -lm -lpthread -Wl,-rpath
-Wl,/usr/local/lib/octave/3.7.5

../liboctave/.libs/liboctave.so: undefined reference to `cublas_dgemm_'

Antworten auf die Frage(3)

Ihre Antwort auf die Frage