Suchergebnisse für Anfrage "cuda"
Wie verwende ich andere c ++ - Compiler mit CUDA unter Windows?
Ich versuche, mit CUDA eine einfache Anwendung zu erstellen, und ich habe stundenlang versucht, sie unter Windows zum Laufen zu bringen. nvcc lehnt es absolut ab, ohne den Compiler von Visual Studio zu kompilieren, der die von mir benötigten ...
Maximale CUDA-Ressourcen festlegen
Ich frage mich, ob es möglich ist, die maximalen GPU-Ressourcen einer CUDA-Anwendung festzulegen. Zum Beispiel, wenn ich eine 4-GB-GPU hatte, aber wollte, dass eine bestimmte Anwendung nur auf 2 GB zugreifen kann und fehlschlägt, wenn sie ...
Generieren von Code für verschiebbare Geräte mit Nvidia Nsight
Ich versuche, ein Beispiel für dynamische Parallelität in CUDA zu kompilieren. Wenn ich versuche, es zu kompilieren, wird Folgendes angezeigt: kernel launch from __device__ or __global__ functions requires separate compilation modes Später ...
CUDA SASS to Cubin
Mit CuObjDump kann SASS mit @ aus Cubin-Dateien generiert werdcuobjdump -sass <input file>, Aber gibt es eine Möglichkeit, den SASS zurück in Cubin zu konvertieren?
nvprof Option für Bandbreite
Was ist die richtige Option zum Messen der Bandbreite mit nvprof --metrics von der Befehlszeile aus? Ich verwende flop_dp_efficiency, um den Prozentsatz der Spitzen-FLOPS zu ermitteln, aber es scheint viele Optionen für die Bandbreitenmessung im ...
Parallelisieren Sie vier und mehr verschachtelte Schleifen mit CUDA
Ich arbeite an einem Compiler, der parallelen C ++ - Code generiert. Ich bin neu in der CUDA-Programmierung, versuche aber, den C ++ - Code mit CUDA zu parallelisieren. Derzeit, wenn ich den folgenden sequentiellen C ++ - Code habe: for(int i ...
Was ist los mit Casting wie (void **) & device_array?
Es gibtdiese Antwort [https://stackoverflow.com/a/7989784/5657194] auf eine andere Frage zur Verwendung voncudaMalloc((void**)&device_array, num_bytes), das @ verwendvoid** als Ausgabeargument anstatt ein @ zu übergebvoid* als Rückgabewert wie ...
CUDA atomicAdd für doppelten Definitionsfehler
In früheren CUDA-Versionen wurde atomicAdd nicht für Doubles implementiert, daher ist es üblich, dies wie @ zu implementiereHie [https://stackoverflow.com/questions/12626096/why-has-atomicadd-not-been-implemented-for-doubles] . Mit der neuen ...
Getting error: "nvlink error: Undefinierter Verweis auf '_ZN8Strategy8backtestEPddd'"
Ich erhalte die folgende Fehlermeldung beim Ausführen vonmake für meine CUDA (v7.5) -Anwendung: nvlink error : Undefined reference to '_ZN8Strategy8backtestEPddd'Ich bin mir nicht sicher warum. Es scheint, dass mit meinem Makefile etwas nicht ...
Wie binde ich ein float * -Array an eine 1D-Textur in cuda?
Ich versuche zu verstehen, wie der Texturspeicher verwendet wird, indem er an ein lineares Gerätearray (kein cudaArray) gebunden wird. Mein Code ist einfach (unten). Ich habe ein float * -Array mit 8 Zahlen, das ich an eine 1D-Textur binden ...