Suchergebnisse für Anfrage "cuda"
Wie kann ich die Anzahl der Kerne im cuda-Gerät ermitteln?
Ich suche nach einer Funktion, die die Anzahl der Kerne meines cuda-Geräts zählt. Ich weiß, dass jeder Mikroprozessor bestimmte Kerne hat und mein cuda-Gerät 2 Mikroprozessoren. Ich habe viel gesucht, um eine Eigenschaftsfunktion zu finden, die ...
JIT in JCuda, Laden mehrerer ptx-Module
Ich sagte inDie [https://stackoverflow.com/questions/32502375/loading-multiple-modules-in-jcuda-is-not-working] frage, dass ich Probleme beim Laden von ptx-Modulen in JCuda hatte, und nach der Idee von @ talonmies implementierte ich eine ...
Laden mehrerer Module in JCuda funktioniert nicht
n jCuda kann man cuda-Dateien als PTX- oder CUBIN-Format laden und aufrufen (starten)__global__ Funktionen (Kernel) aus Java. Unter Berücksichtigung dessen möchte ich mit JCuda ein Framework entwickeln, das @ des Benutzers abruf__device__ ...
Wie werden CUDA-Ereignisse und -Metriken für einen Unterabschnitt einer ausführbaren Datei überwacht (z. B. nur während einer Kernel-Ausführungszeit)?
Ich bin mit der Verwendung von nvprof vertraut, um auf die Ereignisse und Metriken eines Benchmarks zuzugreifen, nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarknameDa system-profiling on ...
Wie erkläre ich Leistungsschwankungen über den PCIe-Bus?
In meinem CUDA-Programm sehe ich große Schwankungen zwischen verschiedenen Läufen (bis zu 50%) in der Kommunikationszeit, einschließlich der Datenübertragungszeiten von Host zu Gerät und von Gerät zu Host über PCI Express für angehefteten ...
Kann jemand Beispielcode bereitstellen, der die Verwendung von 16-Bit-Gleitkommazahlen in cuda demonstriert?
Cuda 7.5 unterstützt 16-Bit-Gleitkommavariablen. Kann jemand einen Beispielcode bereitstellen, der die Verwendung demonstriert?
Cuda Funktion Anwendung elementweise in Cuda
Nach dem Multiplizieren einer Matrix A und eines Vektors x, um das Ergebnis y zu erhalten, möchte ich eine Funktion h elementweise auf y anwenden. Ich möchte z = h erhalten (Ax), wobei h elementweise auf den Vektor A @ angewendet wi x. Ich ...
Pointers in structs übergeben an CUDA
Ich habe jetzt schon eine Weile damit rumgespielt, kann es aber anscheinend nicht richtig machen. Ich versuche, Objekte, die Arrays enthalten, in den CUDA-Gerätespeicher zu kopieren (und wieder zurück, aber ich werde diese Brücke überqueren, ...
Über den Fehlercode "ungültige Gerätefunktion" von nvcc mit compute_- und sm_-Kompilierungsoption
Ich hoffe, Sie können mir helfen, die richtige Compiler-Option für die folgende Karte zu finden: > ./deviceQuery Starting... > > CUDA Device Query (Runtime API) version (CUDART static linking) > > Detected 1 CUDA Capable device(s) > > Device 0: ...
Verwenden Sie cmake, um das cuda-Projekt für vs2013 zu konfigurieren und den Fehler "Ungültige Gerätefunktion" zu erhalten.
Ich verwende das cmake gui-Tool, um mein cuda-Projekt in vs2013 zu konfigurieren. CMakeLists.txt ist wie folgt: project(CUDA_PART) # required cmake version cmake_minimum_required(VERSION 3.0) include_directories(${CUDA_PART_SOURCE_DIR}/common) # ...