Suchergebnisse für Anfrage "cuda"

2 die antwort

Wie kann ich ein bereits geschriebenes paralleles Programm auf einem GPU-Array ausführen lassen?

Ich habe ein neuronales Netzwerk in Erlang geschrieben und gerade eine GeForce GTX 260-Karte mit einer 240-Kern-GPU gekauft. Ist es trivial zu bedienenCUDA [http://en.wikipedia.org/wiki/CUDA]als klebstoff läuft dies auf der grafikkarte?

1 die antwort

Was ist die „Visual Studio-Konfigurationsdatei“, warum sucht nvcc danach, warum kann es sie nicht finden, wie kann man das beheben?

Ich versuche, CUDA-Code über die Befehlszeile mit CUDA Toolkit Version 5.0 und dem Visual Studio 2010 Professional-Compiler zu kompilieren. In Reaktion auf das Folgende, nvcc -c AddVectors.cu -ccbin "C:\Program Files (x86)\Microsoft Visual ...

4 die antwort

Einfache CUDA-Kernel-Optimierung

Um eine Anwendung zu beschleunigen, habe ich einen sehr einfachen Kernel, der das folgende Typ-Casting ausführt: __global__ void UChar2FloatKernel(float *out, unsigned char *in, int nElem){ unsigned int i = (blockIdx.x * blockDim.x) + ...

TOP-Veröffentlichungen

2 die antwort

Reduzieren Sie Matrixspalten mit CUDA

Ich habe eine Matrix und möchte CUDA verwenden und auf schnellstmögliche Weise den spaltenweisen Mittelwert berechnen (es ergibt sich einfach die Summe), d. H. Einen Zeilenvektor zurückgeben, der den Mittelwert jeder Spalte in dieser ...

1 die antwort

Wie kopiere ich eine Tetraeder-Baumstruktur in den CUDA-Gerätespeicher?

Wenn ich die unten stehende Struktur verschieben möchteTetrahedronStruct zum CUDA-Gerätespeicher, wie soll ich vorgehen? struct TetrahedronStruct { int index; int region; TriangleFaces Faces[4]; Vertex Vertices[4]; struct TetrahedronStruct ...

1 die antwort

So strukturieren Sie Daten für eine optimale Geschwindigkeit in einer CUDA-App

Ich versuche, ein einfaches Partikelsystem zu schreiben, das CUDA für die Aktualisierung der Partikelpositionen nutzt. Momentan definiere ich, dass ein Partikel ein Objekt mit einer Position hat, die mit drei Float-Werten definiert ist, und einer ...

3 die antwort

Kompilieren Sie den Code für die CPU

Ich lerne Cuda 5.5, habe aber keine Nvidia-GPU. In der alten Version von nvcc gibt es ein Flag --multicore, um den Code für die CPU zu kompilieren. Was ist die Option in der neuen Version von nvcc? Ich arbeite an Linux.

1 die antwort

Cuda Matrix Inverse Gaussian Jordan

Ich habe keine ähnliche Frage wie meine gefunden. Ich versuche, den Gauß-Jordan-Invers-Matrix-Algorithmus zu schreiben. Die Idee des Algorithmus ist einfach :) Ich möchte nur eine untere Dreiecksmatrix invertieren. Ich habe fast die richtige ...

1 die antwort

cub BlockRadixSort: Wie gehe ich mit großen Kacheln um oder sortiere mehrere Kacheln?

Wenn Sie cub :: BlockRadixSort verwenden, um die Sortierung innerhalb eines Blocks durchzuführen, wie gehen wir damit um, wenn die Anzahl der Elemente zu groß ist? Wenn wir eine Kachelgröße zu groß festlegen, kann sie der gemeinsam genutzte ...

1 die antwort

Wie kann ich eine bestimmte Grafikkarte aktivieren / deaktivieren?

Ich arbeite an einer "Fujitsu" -Maschine. Es sind 2 GPUs installiert: Quadro 2000 und Tesla C2075. Die Quadro-GPU verfügt über 1 GB RAM und die Tesla-GPU über 5 GB. (Ich habe die Ausgabe von nvidia-smi -q überprüft). Wenn ich nvidia-smi ausführe, ...