Suchergebnisse für Anfrage "cuda"
Wie kann eine __global__-Funktion einen Wert RETURN oder BREAK out wie C / C ++ ausführen?
Vor kurzem habe ich Zeichenfolgenvergleichsaufträge für CUDA ausgeführt, und ich frage mich, wie eine __global__ -Funktion einen Wert zurückgeben kann, wenn ...
Berechnung der erreichten Bandbreite und Flops / Gflops und Bewertung der Leistung des CUDA-Kernels
Die meisten Papiere zeigen die Flops / Gflops und erreichten Bandbreite für ihre CUDA-Kernel. Ich habe auch Antworten zum Stackoverflow für die folgenden Fra...
Pitch Alignment für 2D Texturen
2D-Texturen sind eine nützliche Funktion von CUDA in Bildverarbeitungsanwendungen. Um den Pitch-Linear-Speicher an 2D-Texturen zu binden, muss der Speicher a...
Cuda virtuelle Klasse
Ich möchte einige virtuelle Methoden in einem cuda-Kernel ausführen, aber anstatt das Objekt im selben Kernel zu erstellen, möchte ich es auf dem Host erstel...
Warum können Mitgliedsvariablen nicht geteilt werden?
Ich möchte eine Klasse im CUDA-Code instanziieren, die einige ihrer Mitglieder mit anderen Threads im selben Block teilt.Beim Kompilieren des folgenden Codes...
CUDA - Warum ist die verzerrungsbasierte Parallelreduktion langsamer?
Ich hatte die Idee einer Warp-basierten Parallelreduktion, da per Definition alle Threads eines Warps synchron sind.Die Idee war also, dass die Eingabedaten ...
Trichterschicht - was ist das?
Beim Lesen des CUDA 5.0-Programmierhandbuchs bin ich auf eine Funktion namens "Funnel Shift" gestoßen, die in einem 3.5-Computer-fähigen Gerät vorh...
Eigenbibliothek mit nvcc kompilieren (CUDA)
Ich habe versucht folgendes Programm (main.cu) mit dem nvcc (CUDA 5.0 RC) zu kompilieren: