Suchergebnisse für Anfrage "cuda"

2 die antwort

Wie verwende ich andere c ++ - Compiler mit CUDA unter Windows?

Ich versuche, mit CUDA eine einfache Anwendung zu erstellen, und ich habe stundenlang versucht, sie unter Windows zum Laufen zu bringen. nvcc lehnt es absolut ab, ohne den Compiler von Visual Studio zu kompilieren, der die von mir benötigten ...

2 die antwort

Maximale CUDA-Ressourcen festlegen

Ich frage mich, ob es möglich ist, die maximalen GPU-Ressourcen einer CUDA-Anwendung festzulegen. Zum Beispiel, wenn ich eine 4-GB-GPU hatte, aber wollte, dass eine bestimmte Anwendung nur auf 2 GB zugreifen kann und fehlschlägt, wenn sie ...

6 die antwort

Generieren von Code für verschiebbare Geräte mit Nvidia Nsight

Ich versuche, ein Beispiel für dynamische Parallelität in CUDA zu kompilieren. Wenn ich versuche, es zu kompilieren, wird Folgendes angezeigt: kernel launch from __device__ or __global__ functions requires separate compilation modes Später ...

TOP-Veröffentlichungen

4 die antwort

CUDA SASS to Cubin

Mit CuObjDump kann SASS mit @ aus Cubin-Dateien generiert werdcuobjdump -sass <input file>, Aber gibt es eine Möglichkeit, den SASS zurück in Cubin zu konvertieren?

2 die antwort

nvprof Option für Bandbreite

Was ist die richtige Option zum Messen der Bandbreite mit nvprof --metrics von der Befehlszeile aus? Ich verwende flop_dp_efficiency, um den Prozentsatz der Spitzen-FLOPS zu ermitteln, aber es scheint viele Optionen für die Bandbreitenmessung im ...

2 die antwort

Parallelisieren Sie vier und mehr verschachtelte Schleifen mit CUDA

Ich arbeite an einem Compiler, der parallelen C ++ - Code generiert. Ich bin neu in der CUDA-Programmierung, versuche aber, den C ++ - Code mit CUDA zu parallelisieren. Derzeit, wenn ich den folgenden sequentiellen C ++ - Code habe: for(int i ...

2 die antwort

Was ist los mit Casting wie (void **) & device_array?

Es gibtdiese Antwort [https://stackoverflow.com/a/7989784/5657194] auf eine andere Frage zur Verwendung voncudaMalloc((void**)&device_array, num_bytes), das @ verwendvoid** als Ausgabeargument anstatt ein @ zu übergebvoid* als Rückgabewert wie ...

2 die antwort

CUDA atomicAdd für doppelten Definitionsfehler

In früheren CUDA-Versionen wurde atomicAdd nicht für Doubles implementiert, daher ist es üblich, dies wie @ zu implementiereHie [https://stackoverflow.com/questions/12626096/why-has-atomicadd-not-been-implemented-for-doubles] . Mit der neuen ...

2 die antwort

Getting error: "nvlink error: Undefinierter Verweis auf '_ZN8Strategy8backtestEPddd'"

Ich erhalte die folgende Fehlermeldung beim Ausführen vonmake für meine CUDA (v7.5) -Anwendung: nvlink error : Undefined reference to '_ZN8Strategy8backtestEPddd'Ich bin mir nicht sicher warum. Es scheint, dass mit meinem Makefile etwas nicht ...

2 die antwort

Wie binde ich ein float * -Array an eine 1D-Textur in cuda?

Ich versuche zu verstehen, wie der Texturspeicher verwendet wird, indem er an ein lineares Gerätearray (kein cudaArray) gebunden wird. Mein Code ist einfach (unten). Ich habe ein float * -Array mit 8 Zahlen, das ich an eine 1D-Textur binden ...