Suchergebnisse für Anfrage "gpgpu"
Zuweisung von Speicher für Daten, die von MTLBuffer in iOS Metal verwendet werden
Als Folgefrage andiese Antwort [https://stackoverflow.com/a/39134325/3119116]. Ich versuche, eine auf der CPU laufende for-Schleife durch eine Kernelfunktion in Metal zu ersetzen, um die Berechnung zu parallelisieren und die Leistung ...
Python-Echtzeit-Bildklassifizierungsprobleme mit neuronalen Netzen
Ich versuche, mit Caffe und Python Bilder in Echtzeit zu klassifizieren. Ich verwende OpenCV, um in einem Prozess von meiner Webcam zu streamen, und in einem separaten Prozess, um mithilfe von caffe eine Bildklassifizierung für die von der ...
Maximale CUDA-Ressourcen festlegen
Ich frage mich, ob es möglich ist, die maximalen GPU-Ressourcen einer CUDA-Anwendung festzulegen. Zum Beispiel, wenn ich eine 4-GB-GPU hatte, aber wollte, dass eine bestimmte Anwendung nur auf 2 GB zugreifen kann und fehlschlägt, wenn sie ...
Was ist kohärenter Speicher auf der GPU?
Ich bin nicht ein einziges Mal auf den Begriff "nicht kohärent" und "kohärent" im Gedächtnis gestoßen tech papers [https://renderdoc.org/vulkan-in-30-minutes.html]ch habe nach einer einfachen und klaren Erklärung gesucht, aber hauptsächlich ...
Wie verwende ich Nvidia Multi-Process Service (MPS), um mehrere Nicht-MPI-CUDA-Anwendungen auszuführen?
Kann ich Nicht-MPI-CUDA-Anwendungen gleichzeitig auf NVIDIA Kepler-GPUs mit MPS ausführen? Ich würde dies gerne tun, weil meine Anwendungen die GPU nicht voll ausnutzen können und ich möchte, dass sie zusammen laufen. Gibt es ein Codebeispiel dafür?
Mehr als eine CUDA-Anwendung auf einer GPU ausführen
as @ CUDA-Dokument gibt nicht an, wie viele CUDA-Prozesse eine GPU gemeinsam nutzen können. Zum Beispiel, wenn ich mehr als ein CUDA-Programm vom selben Benutzer mit nur einer im System installierten GPU-Karte starte, was ist der Effekt? Wird es ...
Passing Host Function als Funktionszeiger in __global__ OR __device__ function in CUDA
Ich entwickle gerade eine GPU-Version einer CPU-Funktion (zB Funktion Calc (int a, int b, double * c, souble * d, CalcInvFunction GetInv)), bei der eine Host-Funktion als Funktionszeiger übergeben wird (zB in obiges Beispiel GetInv ist die ...
Simple Thrust-Code ist ungefähr halb so schnell wie mein naiver cuda-Kernel. Benutze ich Thrust falsch?
Ich bin ziemlich neu in Cuda und Thrust, aber mein Eindruck war, dass Thrust, wenn es gut verwendet wird, eine bessere Leistung bieten soll als naiv geschriebene Cuda-Kernel. Verwende ich Thrust nicht optimal? Unten finden Sie ein vollständiges, ...
Zugriff auf Dateisystem mit CPU-Gerät in opencl
Ich bin ein Neuling zu opencl. Ich habe Zweifel an der Funktionsweise von opencl, wenn der Kernel auf einem CPU-Gerät ausgeführt wird. Angenommen, auf einem CPU-Gerät läuft ein Kernel, der aus einer Datei auf der Festplatte gelesen werden kann. ...
Wie starte ich einen benutzerdefinierten OpenCL-Kernel in OpenCV (3.0.0) OCL?
Ich missbrauche OpenCV wahrscheinlich, indem ich es als Wrapper für die offiziellen OpenCL C ++ - Bindungen verwende, damit ich meine eigenen Kernel starten kann. OpenCV hat jedoch Klassen wie Program, ProgramSource, Kernel, Queue usw., ...