Suchergebnisse für Anfrage "gpu-programming"

2 die antwort

CUDA-Schub: Reduziere_durch_Taste auf nur einige Werte in einem Array, basierend auf Werten in einem "Schlüssel" -Array

Nehmen wir an, ich habe zwei device_vector <byte> -Arrays.

4 die antwort

Was ist kohärenter Speicher auf der GPU?

Ich bin nicht ein einziges Mal auf den Begriff "nicht kohärent" und "kohärent" im Gedächtnis gestoßen tech papers [https://renderdoc.org/vulkan-in-30-minutes.html]ch habe nach einer einfachen und klaren Erklärung gesucht, aber hauptsächlich ...

1 die antwort

Unterschiede zwischen VexCL, Thrust und Boost.Compute

TOP-Veröffentlichungen

2 die antwort

GPU-Optimierung für vektorisierten Code

function w=oja(X, varargin) % get the dimensionality [m n] = size(X); % random initial weights w = randn(m,1); options = struct( ... 'rate', .00005, ... 'niter', 5000, ... 'delta', .0001); options = getopt(options, varargin); success = 0; % run ...

1 die antwort

Die Verknüpfung mit CUDA-Bibliotheken von Drittanbietern verlangsamt cudaMalloc

4 die antwort

Wie man einen CUDA-Kernel vom Host-Code aus unterbricht oder abbricht

Ich arbeite mit CUDA und ich versuche, meine Kernel-Arbeit zu beenden (d. H. Alle laufenden Threads zu beenden), nachdem ein bestimmtesif Block wird getroffen. Wie kann ich das machen? Ich stecke hier wirklich fest.

2 die antwort

OpenCL-Code 'Fehler MSB3721' für Intel OpenCL SDK unter Visual Studio 2010

Ich verwende derzeit Intels OpenCL SDK-Plattform für heterogene parallele Programmierung (OpenCL). Ich verwende dazu Visual Studio 2010 Ultimate. Mein System enthält keine GPU. Ich habe an der CUDA SDK-Plattform für OpenCl-Programmierung ...

4 die antwort

Warum ist MATLAB gpuarray viel langsamer, wenn man nur zwei Matrizen hinzufügt?

Ich habe kürzlich die MATLAB CUDA-Bibliothek für einige absolut einfache Matrixberechnungen auf GPU verwendet. Aber die Leistungsergebnisse sind sehr seltsam. Kann mir jemand helfen zu verstehen, was genau los ist und wie ich das Problem lösen ...

2 die antwort

Verwenden von Java mit Nvidia-GPUs (cuda)

Ich arbeite an einem Geschäftsprojekt, das in Java durchgeführt wird und eine enorme Rechenleistung benötigt, um Geschäftsmärkte zu berechnen. Einfache Mathematik, aber mit riesigen Datenmengen. Wir haben ein paar cuda gpus bestellt, um es zu ...

6 die antwort

So ermitteln Sie die maximale Chargengröße für ein seq2seq-Tensorflow-RNN-Trainingsmodell

Gegenwärtig verwende ich die Standardgröße 64 als Chargengröße für das seq2seq-Tensorflow-Modell. Was ist die maximale Batch-Größe, Layer-Größe usw. Ich kann mit einer einzelnen Titan X-GPU mit 12 GB RAM mit Haswell-E xeon 128 GB RAM gehen. Die ...