Suchergebnisse für Anfrage "cuda"

2 die antwort

Detecting ptx Kernel von Thrust transform

Ich habe folgenden Schub :: Transformationsaufruf. my_functor *f_1 = new my_functor(); thrust::transform(data.begin(), data.end(), data.begin(),*f_1);Ich möchte den entsprechenden Kernel in der PTX-Datei erkennen. Aber es gibt viele Kernel, die ...

2 die antwort

Wie binde ich ein float * -Array an eine 1D-Textur in cuda?

Ich versuche zu verstehen, wie der Texturspeicher verwendet wird, indem er an ein lineares Gerätearray (kein cudaArray) gebunden wird. Mein Code ist einfach (unten). Ich habe ein float * -Array mit 8 Zahlen, das ich an eine 1D-Textur binden ...

4 die antwort

Warum stürzt mein CUDA-Kernel (nicht angegebener Startfehler) mit einer anderen Datensatzgröße ab?

Ich habe einen Kernel, um verschiedene Elemente einer Matrix basierend auf ihrer Position (diagonal oder nicht diagonal) zu berechnen. Der Kernel funktioniert bei der Berechnung von Matrizen mit folgenden Größen wie erwartet: 14 x 14 (Ich ...

TOP-Veröffentlichungen

6 die antwort

CUDA: Stoppen Sie alle anderen Threads

Ich habe ein Problem, das anscheinend lösbar ist, indem ich alle möglichen Lösungen aufführe und dann die besten finde. Zu diesem Zweck habe ich einen Backtracking-Algorithmus entwickelt, der die beste Lösung auflistet und speichert, wenn sie ...

2 die antwort

Getting error: "nvlink error: Undefinierter Verweis auf '_ZN8Strategy8backtestEPddd'"

Ich erhalte die folgende Fehlermeldung beim Ausführen vonmake für meine CUDA (v7.5) -Anwendung: nvlink error : Undefined reference to '_ZN8Strategy8backtestEPddd'Ich bin mir nicht sicher warum. Es scheint, dass mit meinem Makefile etwas nicht ...

2 die antwort

CUDA atomicAdd für doppelten Definitionsfehler

In früheren CUDA-Versionen wurde atomicAdd nicht für Doubles implementiert, daher ist es üblich, dies wie @ zu implementiereHie [https://stackoverflow.com/questions/12626096/why-has-atomicadd-not-been-implemented-for-doubles] . Mit der neuen ...

2 die antwort

Was ist los mit Casting wie (void **) & device_array?

Es gibtdiese Antwort [https://stackoverflow.com/a/7989784/5657194] auf eine andere Frage zur Verwendung voncudaMalloc((void**)&device_array, num_bytes), das @ verwendvoid** als Ausgabeargument anstatt ein @ zu übergebvoid* als Rückgabewert wie ...

2 die antwort

nvprof Option für Bandbreite

Was ist die richtige Option zum Messen der Bandbreite mit nvprof --metrics von der Befehlszeile aus? Ich verwende flop_dp_efficiency, um den Prozentsatz der Spitzen-FLOPS zu ermitteln, aber es scheint viele Optionen für die Bandbreitenmessung im ...

2 die antwort

Parallelisieren Sie vier und mehr verschachtelte Schleifen mit CUDA

Ich arbeite an einem Compiler, der parallelen C ++ - Code generiert. Ich bin neu in der CUDA-Programmierung, versuche aber, den C ++ - Code mit CUDA zu parallelisieren. Derzeit, wenn ich den folgenden sequentiellen C ++ - Code habe: for(int i ...

4 die antwort

CUDA SASS to Cubin

Mit CuObjDump kann SASS mit @ aus Cubin-Dateien generiert werdcuobjdump -sass <input file>, Aber gibt es eine Möglichkeit, den SASS zurück in Cubin zu konvertieren?