Suchergebnisse für Anfrage "gpgpu"

2 die antwort

Beibehalten des Skalarprodukts auf der GPGPU mithilfe der CUBLAS-Routine

4 die antwort

Überlappende Übertragungen und Geräteberechnung in OpenCL

2 die antwort

Berechnung der erreichten Bandbreite und Flops / Gflops und Bewertung der Leistung des CUDA-Kernels

Die meisten Papiere zeigen die Flops / Gflops und erreichten Bandbreite für ihre CUDA-Kernel. Ich habe auch Antworten zum Stackoverflow für die folgenden Fra...

TOP-Veröffentlichungen

2 die antwort

CUDA - Warum ist die verzerrungsbasierte Parallelreduktion langsamer?

Ich hatte die Idee einer Warp-basierten Parallelreduktion, da per Definition alle Threads eines Warps synchron sind.Die Idee war also, dass die Eingabedaten ...

2 die antwort

OpenGL Compute Shader-Aufrufe

Ich habe eine Frage zu den neuen Compute-Shadern. Ich arbeite gerade an einem Partikelsystem. Ich speichere alle meine Partikel im Shader-Speicherpuffer, um ...

1 die antwort

OpenCL Dynamic Parallelism / GPU-gespawnte Threads?

CUDA 5wurde gerade veröffentlicht und damit die Fähigkeit, GPU-Threads aus einem anderen GPU-Thread (Haupt-Thread?) heraus zu erzeugen, um die bisher beobach...

1 die antwort

Senden eines 3D-Arrays an den CUDA-Kernel

Ich habe den angegebenen Code als Antwort auf genommenWie kann ich zwei 2d (pitched) Arrays mithilfe von verschachtelten for-Schleifen addieren? und versucht...

5 die antwort

Wie ordne ich Arrays innerhalb eines Kernels dynamisch zu?

2 die antwort

Strategien für das Timing von CUDA-Kerneln: Vor- und Nachteile?

Beim Timing von CUDA-Kerneln funktioniert Folgendes nicht, da der Kernel die Ausführung des CPU-Programms während der Ausführung nicht blockiert:

1 die antwort

cuBLAS argmin - Fehler bei der Ausgabe in den Gerätespeicher?