Suchergebnisse für Anfrage "cuda"

6 die antwort

Wie kann ich die Anzahl der Kerne im cuda-Gerät ermitteln?

Ich suche nach einer Funktion, die die Anzahl der Kerne meines cuda-Geräts zählt. Ich weiß, dass jeder Mikroprozessor bestimmte Kerne hat und mein cuda-Gerät 2 Mikroprozessoren. Ich habe viel gesucht, um eine Eigenschaftsfunktion zu finden, die ...

2 die antwort

JIT in JCuda, Laden mehrerer ptx-Module

Ich sagte inDie [https://stackoverflow.com/questions/32502375/loading-multiple-modules-in-jcuda-is-not-working] frage, dass ich Probleme beim Laden von ptx-Modulen in JCuda hatte, und nach der Idee von @ talonmies implementierte ich eine ...

2 die antwort

Laden mehrerer Module in JCuda funktioniert nicht

n jCuda kann man cuda-Dateien als PTX- oder CUBIN-Format laden und aufrufen (starten)__global__ Funktionen (Kernel) aus Java. Unter Berücksichtigung dessen möchte ich mit JCuda ein Framework entwickeln, das @ des Benutzers abruf__device__ ...

TOP-Veröffentlichungen

4 die antwort

Wie werden CUDA-Ereignisse und -Metriken für einen Unterabschnitt einer ausführbaren Datei überwacht (z. B. nur während einer Kernel-Ausführungszeit)?

Ich bin mit der Verwendung von nvprof vertraut, um auf die Ereignisse und Metriken eines Benchmarks zuzugreifen, nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarknameDa system-profiling on ...

2 die antwort

Wie erkläre ich Leistungsschwankungen über den PCIe-Bus?

In meinem CUDA-Programm sehe ich große Schwankungen zwischen verschiedenen Läufen (bis zu 50%) in der Kommunikationszeit, einschließlich der Datenübertragungszeiten von Host zu Gerät und von Gerät zu Host über PCI Express für angehefteten ...

2 die antwort

Kann jemand Beispielcode bereitstellen, der die Verwendung von 16-Bit-Gleitkommazahlen in cuda demonstriert?

Cuda 7.5 unterstützt 16-Bit-Gleitkommavariablen. Kann jemand einen Beispielcode bereitstellen, der die Verwendung demonstriert?

2 die antwort

Cuda Funktion Anwendung elementweise in Cuda

Nach dem Multiplizieren einer Matrix A und eines Vektors x, um das Ergebnis y zu erhalten, möchte ich eine Funktion h elementweise auf y anwenden. Ich möchte z = h erhalten (Ax), wobei h elementweise auf den Vektor A @ angewendet wi x. Ich ...

4 die antwort

Pointers in structs übergeben an CUDA

Ich habe jetzt schon eine Weile damit rumgespielt, kann es aber anscheinend nicht richtig machen. Ich versuche, Objekte, die Arrays enthalten, in den CUDA-Gerätespeicher zu kopieren (und wieder zurück, aber ich werde diese Brücke überqueren, ...

2 die antwort

Über den Fehlercode "ungültige Gerätefunktion" von nvcc mit compute_- und sm_-Kompilierungsoption

Ich hoffe, Sie können mir helfen, die richtige Compiler-Option für die folgende Karte zu finden: > ./deviceQuery Starting... > > CUDA Device Query (Runtime API) version (CUDART static linking) > > Detected 1 CUDA Capable device(s) > > Device 0: ...

2 die antwort

Verwenden Sie cmake, um das cuda-Projekt für vs2013 zu konfigurieren und den Fehler "Ungültige Gerätefunktion" zu erhalten.

Ich verwende das cmake gui-Tool, um mein cuda-Projekt in vs2013 zu konfigurieren. CMakeLists.txt ist wie folgt: project(CUDA_PART) # required cmake version cmake_minimum_required(VERSION 3.0) include_directories(${CUDA_PART_SOURCE_DIR}/common) # ...