Suchergebnisse für Anfrage "nvidia"
CUDA: Addition von zwei Zahlen mit falscher Antwort
Hier ist das Programm #include <stdio.h> #include <cuda.h> #include <cuda_runtime.h> #include <device_launch_parameters.h> __global__ void Addition(int *a,int *b,int *c) { *c = *a + *b; } int main() { int a,b,c; int *dev_a,*dev_b,*dev_c; int ...
Wie kann ich Tensorflow auf einer GPU mit der Fähigkeit 2.0 ausführen lassen?
Ich habe tensorflow (GPU) erfolgreich unter Linux Ubuntu 16.04 installiert und einige kleine Änderungen vorgenommen, damit es mit der neuen Ubuntu LTS-Version funktioniert. Ich dachte jedoch (wer weiß warum), dass meine GPU die ...
Leistung der CUDA-Atomoperation in verschiedenen Szenarien
Als ich rüberkamdiese Frage [https://stackoverflow.com/q/22342685/2386951]Auf SO war ich gespannt auf die Antwort. Deshalb habe ich den folgenden Code geschrieben, um die Leistung der atomaren Operationen in verschiedenen Szenarien zu testen. Das ...
CUDA streamt Zerstörung und CudaDeviceReset
Ich habe die folgende Klasse mit CUDA-Streams implementiert
Strategien für das Timing von CUDA-Kerneln: Vor- und Nachteile?
Beim Timing von CUDA-Kerneln funktioniert Folgendes nicht, da der Kernel die Ausführung des CPU-Programms während der Ausführung nicht blockiert:
Mehr als eine CUDA-Anwendung auf einer GPU ausführen
as @ CUDA-Dokument gibt nicht an, wie viele CUDA-Prozesse eine GPU gemeinsam nutzen können. Zum Beispiel, wenn ich mehr als ein CUDA-Programm vom selben Benutzer mit nur einer im System installierten GPU-Karte starte, was ist der Effekt? Wird es ...
CUDA schlägt fehl, wenn versucht wird, sowohl die integrierte iGPU- als auch die Nvidia-Karte zu verwenden. Wie kann ich sowohl diskretes NVIDIA als auch integriertes (integriertes) Intel GPU verwenden? [geschlossen
Ich hatte kürzlich einige Probleme damit, meinen PC (ivybridge) dazu zu bringen, die integrierte GPU (Intel IgPU HD4000) für die normale Verwendung der Bildschirmanzeige zu verwenden, während ich mein CUDA Programme für Berechnungen auf dem ...
Grundlegendes zu CUDA-Rastermaßen, Blockmaßen und Thread-Organisation (einfache Erklärung) [geschlossen]
Wie werden Threads so organisiert, dass sie von einer GPU ausgeführt werden?
CUDA - Wie viel langsamer wird über PCI-E übertragen?
Wenn ich ein einzelnes Byte von einem CUDA-Kernel auf PCI-E zum Host (Nullkopiespeicher) übertrage, wie langsam ist es im Vergleich zur Übertragung von 200 M...
Mittlere Auswahl im CUDA-Kernel
Ich muss den Median eines Arrays der Größe p in einem CUDA-Kernel berechnen (in meinem Fall ist p klein, z. B. p = 10). Ich verwende einen O (p ^ 2) -Algorit...