Umwandlung von Octave in CuBLAS
Ich möchte Octave konvertieren, um CuBLAS für die Matrixmultiplikation zu verwenden. In diesem Video scheint es so einfach zu sein, 28 Zeichen einzugeben:
Verwenden der CUDA-Bibliothek zur Beschleunigung von Anwendungen
In der Praxis ist es etwas komplexer. Weiß jemand, welche zusätzlichen Arbeiten erforderlich sind, um die in dieser Videokompilierung vorgenommenen Änderungen vorzunehmen?
AKTUALISIERENHier ist die Methode, die ich versuche
in dMatrix.cc hinzufügen
#include <cublas.h>
in dMatrix.cc alle Vorkommen von ändern (Groß- / Kleinschreibung beibehalten)
dgemm
zu
cublas_dgemm
in meinem Build-Terminal-Set
export CC=nvcc
export CFLAGS="-lcublas -lcudart"
export CPPFLAGS="-I/usr/local/cuda/include"
export LDFLAGS="-L/usr/local/cuda/lib64"
Der Fehler, den ich erhalte, ist:
libtool: link: g++ -I/usr/include/freetype2 -Wall -W -Wshadow -Wold-style-cast
-Wformat -Wpointer-arith -Wwrite-strings -Wcast-align -Wcast-qual -g -O2
-o .libs/octave octave-main.o -L/usr/local/cuda/lib64
../libgui/.libs/liboctgui.so ../libinterp/.libs/liboctinterp.so
../liboctave/.libs/liboctave.so -lutil -lm -lpthread -Wl,-rpath
-Wl,/usr/local/lib/octave/3.7.5
../liboctave/.libs/liboctave.so: undefined reference to `cublas_dgemm_'