Suchergebnisse für Anfrage "cuda"
Wie verwende ich Nvidia Multi-Process Service (MPS), um mehrere Nicht-MPI-CUDA-Anwendungen auszuführen?
Kann ich Nicht-MPI-CUDA-Anwendungen gleichzeitig auf NVIDIA Kepler-GPUs mit MPS ausführen? Ich würde dies gerne tun, weil meine Anwendungen die GPU nicht voll ausnutzen können und ich möchte, dass sie zusammen laufen. Gibt es ein Codebeispiel dafür?
So geben Sie den Intel C ++ - Compiler icl als Host-Compiler eines CUDA-Projekts in Visual Studio an
Auf der Seite mit den Projekteigenschaften des CUDA-Projekts in Visual Studio scheint es die Möglichkeit zu geben, den Host-Compiler anzupassen. Aber nachdem ich den Intel C ++ - Compiler ausgewählt habe, zeigt die Option -ccbin immer noch auf ...
Versuchen, CUDA 7.5 für GCC 5.x zum Laufen zu bringen
So, wenn Sie versuchen, nvcc zu verwenden, wenn das System-GCC Version 5 oder höher ist, wird der Fehler "Nicht unterstützte Version" angezeigt. Aber - ich habe gehört, dass Leute berichten, dass sie dies gerade auskommentiert haben und dass CUDA ...
CUDA - Objekte im Kernel erstellen und auf dem Host verwenden [duplizieren]
Diese Frage hat hier bereits eine Antwort: Wie kopiere ich den in der Gerätefunktion zugewiesenen Speicher zurück in den Hauptspeicher? [/questions/13043164/how-to-copy-the-memory-allocated-in-device-function-back-to-main-memory] 1 AntwortIch ...
Wie man einen CUDA-Kernel vom Host-Code aus unterbricht oder abbricht
Ich arbeite mit CUDA und ich versuche, meine Kernel-Arbeit zu beenden (d. H. Alle laufenden Threads zu beenden), nachdem ein bestimmtesif Block wird getroffen. Wie kann ich das machen? Ich stecke hier wirklich fest.
Wie erkläre ich die Wiederholung von Anweisungen in CUDA?
Kann jemand die Definition und die Gründe für verschiedene Arten von Anweisungswiederholungen in CUDA zusammenfassen? Sie sind inst_replay_overhead:shared_replay_overhead:global_replay_overhead: global_cache_replay_overhead ...
CUDA: Wie verwende ich -arch und -code und SM vs COMPUTE
Ich bin mir immer noch nicht sicher, wie ich die Architekturen für die Codegenerierung beim Erstellen mit nvcc richtig spezifizieren soll. Mir ist bekannt, dass in meiner Binärdatei sowohl Maschinencode als auch PTX-Code enthalten sind und dass ...
Cast char * to unsigned int * in CUDA
Ich habe einen Typ definiert alstypedef unsigned char uint40[5] und dann habe ich ein Array von uint40, sagen Sieuint40* payloads Ich habe versucht, die folgende Funktion in einen CUDA-Kernel zu portieren. void aSimpleFunction(int M, uint40* ...
CUDA: Kopieren eines 1D-Arrays von der GPU in ein 2D-Array auf Host
int main() { char** hMat,* dArr; hMat = new char*[10]; for (int i=0;i<10;i++) { hMat[i] = new char[10]; } cudaMalloc((void**)&dArr,100); // Copy from dArr to hMat here: }Ich habe ein Array,dArr auf der GPU, und ich möchte es in ein 2D-Array ...
Machen Sie die Anzahl der Schlüsselvorkommen mit CUDA / Thrust @ glei
Gibt es eine effiziente Möglichkeit, ein sortiertes Schlüssel / Wert-Array-Paar zu verwenden und sicherzustellen, dass jeder Schlüssel über die CUDA Thrust-Bibliothek die gleiche Anzahl von Elementen verfügt? Nehmen wir zum Beispiel an, wir ...