Suchergebnisse für Anfrage "cuda"

2 die antwort

Wie verwende ich Nvidia Multi-Process Service (MPS), um mehrere Nicht-MPI-CUDA-Anwendungen auszuführen?

Kann ich Nicht-MPI-CUDA-Anwendungen gleichzeitig auf NVIDIA Kepler-GPUs mit MPS ausführen? Ich würde dies gerne tun, weil meine Anwendungen die GPU nicht voll ausnutzen können und ich möchte, dass sie zusammen laufen. Gibt es ein Codebeispiel dafür?

4 die antwort

So geben Sie den Intel C ++ - Compiler icl als Host-Compiler eines CUDA-Projekts in Visual Studio an

Auf der Seite mit den Projekteigenschaften des CUDA-Projekts in Visual Studio scheint es die Möglichkeit zu geben, den Host-Compiler anzupassen. Aber nachdem ich den Intel C ++ - Compiler ausgewählt habe, zeigt die Option -ccbin immer noch auf ...

6 die antwort

Versuchen, CUDA 7.5 für GCC 5.x zum Laufen zu bringen

So, wenn Sie versuchen, nvcc zu verwenden, wenn das System-GCC Version 5 oder höher ist, wird der Fehler "Nicht unterstützte Version" angezeigt. Aber - ich habe gehört, dass Leute berichten, dass sie dies gerade auskommentiert haben und dass CUDA ...

TOP-Veröffentlichungen

2 die antwort

CUDA - Objekte im Kernel erstellen und auf dem Host verwenden [duplizieren]

Diese Frage hat hier bereits eine Antwort: Wie kopiere ich den in der Gerätefunktion zugewiesenen Speicher zurück in den Hauptspeicher? [/questions/13043164/how-to-copy-the-memory-allocated-in-device-function-back-to-main-memory] 1 AntwortIch ...

4 die antwort

Wie man einen CUDA-Kernel vom Host-Code aus unterbricht oder abbricht

Ich arbeite mit CUDA und ich versuche, meine Kernel-Arbeit zu beenden (d. H. Alle laufenden Threads zu beenden), nachdem ein bestimmtesif Block wird getroffen. Wie kann ich das machen? Ich stecke hier wirklich fest.

2 die antwort

Wie erkläre ich die Wiederholung von Anweisungen in CUDA?

Kann jemand die Definition und die Gründe für verschiedene Arten von Anweisungswiederholungen in CUDA zusammenfassen? Sie sind inst_replay_overhead:shared_replay_overhead:global_replay_overhead: global_cache_replay_overhead ...

2 die antwort

CUDA: Wie verwende ich -arch und -code und SM vs COMPUTE

Ich bin mir immer noch nicht sicher, wie ich die Architekturen für die Codegenerierung beim Erstellen mit nvcc richtig spezifizieren soll. Mir ist bekannt, dass in meiner Binärdatei sowohl Maschinencode als auch PTX-Code enthalten sind und dass ...

2 die antwort

Cast char * to unsigned int * in CUDA

Ich habe einen Typ definiert alstypedef unsigned char uint40[5] und dann habe ich ein Array von uint40, sagen Sieuint40* payloads Ich habe versucht, die folgende Funktion in einen CUDA-Kernel zu portieren. void aSimpleFunction(int M, uint40* ...

2 die antwort

CUDA: Kopieren eines 1D-Arrays von der GPU in ein 2D-Array auf Host

int main() { char** hMat,* dArr; hMat = new char*[10]; for (int i=0;i<10;i++) { hMat[i] = new char[10]; } cudaMalloc((void**)&dArr,100); // Copy from dArr to hMat here: }Ich habe ein Array,dArr auf der GPU, und ich möchte es in ein 2D-Array ...

2 die antwort

Machen Sie die Anzahl der Schlüsselvorkommen mit CUDA / Thrust @ glei

Gibt es eine effiziente Möglichkeit, ein sortiertes Schlüssel / Wert-Array-Paar zu verwenden und sicherzustellen, dass jeder Schlüssel über die CUDA Thrust-Bibliothek die gleiche Anzahl von Elementen verfügt? Nehmen wir zum Beispiel an, wir ...