Suchergebnisse für Anfrage "cuda"
Das Skalarprodukt zweier Gleitkomma-Vektoren mit einfacher Genauigkeit liefert im CUDA-Kernel andere Ergebnisse als auf dem Host
Während des Debuggens von CUDA-Code habe ich mit äquivalentem CPU-Code verglichen
Summieren der Zeilen einer Matrix (in Zeilen- oder Spaltenreihenfolge gespeichert) in CUDA
Ich arbeite an dem Problem, die Zeilen einer Matrix in CUDA zu summieren. Ich gebe das folgende Beispiel.Angenommen, Sie haben Folgendes
Wie definiere ich den Zielgeräte-Stream in cudaMemcpyPeerAsync ()?
Ich mache eine asynchrone memcpy von gpu0 bis gpu1 mit cudaMemcpyPeerAsync ().cudaMemcpyAsync () bietet die Option, dass der Stream für gpu0 verwendet wird, ...
Die verschiedenen Adressierungsarten von CUDA-Texturen
Ich verwende eine CUDA-Textur im Rahmenadressierungsmodus (
CUDA / OpenGL-Interop, mit CUDA auf OpenGL-Textur zeichnen
Ich schreibe ein Rendering-System in CUDA und möchte, dass die Ergebnisse schnell über OpenGL angezeigt werden, ohne den Hauptspeicher zu berühren. Grundsätz...
Das Kompilieren von Code mit dynamischer Parallelität schlägt fehl
Ich programmiere dynamisch parallel mit CUDA 5.5 und einer NVDIA GeForce GTX 780, deren Rechenleistung 3.5 beträgt. Ich rufe eine Kernelfunktion in einer Ker...
Cuda Clang und OS X Mavericks
Ich versuche gerade, ein Cuda-Projekt mit Cmake unter MacOS 10.9 zu erstellen. Mein C und C ++ Compiler ist gcc, aber es scheint, dass seit Mavericks gcc und...