Suchergebnisse für Anfrage "dynamic-parallelism"
Generieren von Code für verschiebbare Geräte mit Nvidia Nsight
Ich versuche, ein Beispiel für dynamische Parallelität in CUDA zu kompilieren. Wenn ich versuche, es zu kompilieren, wird Folgendes angezeigt: kernel launch from __device__ or __global__ functions requires separate compilation modes Später ...
Dynamische Parallelität - das Starten vieler kleiner Kernel ist sehr langsam
Ich versuche, dynamische Parallelität zu verwenden, um einen Algorithmus zu verbessern, den ich in CUDA habe. In meiner ursprünglichen CUDA-Lösung berechnet jeder Thread eine Zahl, die für jeden Block gleich ist. Was ich tun möchte, ist, zuerst ...