Suchergebnisse für Anfrage "gpgpu"
Berechnung der erreichten Bandbreite und Flops / Gflops und Bewertung der Leistung des CUDA-Kernels
Die meisten Papiere zeigen die Flops / Gflops und erreichten Bandbreite für ihre CUDA-Kernel. Ich habe auch Antworten zum Stackoverflow für die folgenden Fra...
CUDA - Warum ist die verzerrungsbasierte Parallelreduktion langsamer?
Ich hatte die Idee einer Warp-basierten Parallelreduktion, da per Definition alle Threads eines Warps synchron sind.Die Idee war also, dass die Eingabedaten ...
OpenGL Compute Shader-Aufrufe
Ich habe eine Frage zu den neuen Compute-Shadern. Ich arbeite gerade an einem Partikelsystem. Ich speichere alle meine Partikel im Shader-Speicherpuffer, um ...
OpenCL Dynamic Parallelism / GPU-gespawnte Threads?
CUDA 5wurde gerade veröffentlicht und damit die Fähigkeit, GPU-Threads aus einem anderen GPU-Thread (Haupt-Thread?) heraus zu erzeugen, um die bisher beobach...
Senden eines 3D-Arrays an den CUDA-Kernel
Ich habe den angegebenen Code als Antwort auf genommenWie kann ich zwei 2d (pitched) Arrays mithilfe von verschachtelten for-Schleifen addieren? und versucht...
Strategien für das Timing von CUDA-Kerneln: Vor- und Nachteile?
Beim Timing von CUDA-Kerneln funktioniert Folgendes nicht, da der Kernel die Ausführung des CPU-Programms während der Ausführung nicht blockiert: