Suchergebnisse für Anfrage "cuda"

2 die antwort

Asynchrones Kopieren des Speichers vom Host auf das Gerät mithilfe von Thrust- und CUDA-Streams

Ich möchte mit thrust as in Speicher vom Host auf das Gerät kopieren thrust::host_vector<float> h_vec(1 << 28); thrust::device_vector<float> d_vec(1 << 28); thrust::copy(h_vec.begin(), h_vec.end(), d_vec.begin());Verwenden von CUDA-Streams ...

2 die antwort

gpuDevice () Toolkit Version immer 5.5

Unabhängig davon, wie ich den CUDA-Treiber und das Toolkit neu installiere, wird bei der Eingabe von gpuDevice () immer Folgendes angezeigt: CUDADevice with properties: Name: 'Quadro K2000M' Index: 1 ComputeCapability: '3.0' SupportsDouble: 1 ...

6 die antwort

Verwenden Sie eine GPU aus einem Docker-Container?

Ich suche nach einer Möglichkeit, die GPU in einem Docker-Container zu verwenden. Der Container führt beliebigen Code aus, sodass ich den privilegierten Modus nicht verwenden möchte. Irgendwelche Tipps? Aus früheren Forschungen habe ich das ...

TOP-Veröffentlichungen

1 die antwort

Soft Thresholding CUDA-Implementierung

Ich frage mich, wie ich einen netten Kernel mit Soft Thresholding-Funktion in CUDA implementieren soll. Die Funktion für weiche Schwellenwerte sieht wie folgt aus: Dabei ist Lambda der Schwellenwert und x der Eingabevektor oder ...

1 die antwort

Für welche Größen werden Normalladevorgänge in CUDA atomic im globalen Speicher gespeichert?

Sind allgemeine Lese- und Schreibvorgänge im globalen Speicher in CUDA atomar, wenn: Es ist eine 4-Byte-Anweisung? (Ich nehme ja an)Es ist eine 8-Byte- oder 16-Byte-Anweisung? (Ich nehme ja an)Sind zumindest auf Kepler- und Fermi-Ebene 4 Byte ...

1 die antwort

Dynamische Parallelität - das Starten vieler kleiner Kernel ist sehr langsam

Ich versuche, dynamische Parallelität zu verwenden, um einen Algorithmus zu verbessern, den ich in CUDA habe. In meiner ursprünglichen CUDA-Lösung berechnet jeder Thread eine Zahl, die für jeden Block gleich ist. Was ich tun möchte, ist, zuerst ...

2 die antwort

Zufallszahlen generieren: CPU vs. GPU, welche gewinnt aktuell?

Ich habe an einer Physiksimulation gearbeitet, die die Erzeugung einer großen Anzahl von Zufallszahlen erfordert (mindestens 10 ^ 13, wenn Sie eine Idee haben möchten). Ich habe die C ++ 11-Implementierung des Mersenne-Twisters verwendet. Ich ...

1 die antwort

Member "Wurde bereits als Fehler deklariert" bei CUDA und Eigen

Ich bin nur ein Anfänger mit CUDA und Nsight und möchte eine hervorragende GPU-Leistung für lineare Algebra-Operationen (z. B. CUBLAS) nutzen. Ich habe mit Hilfe von eine Menge benutzerdefinierten Code ...

1 die antwort

CUDA: In Warp Reduction und Volatile Keyword

Nach dem Lesen der Frage und ihrer Antwort aus dem Folgenden VERKNÜPFUNG [https://stackoverflow.com/questions/12733084/cuda-why-is-warp-based-parallel-reduction-slower] Ich habe noch eine Frage im Kopf. Aus meinem Hintergrund in C / C ++; ...

1 die antwort

CUDA-printf in einen C ++ - Stream umleiten

ProblemstellungIch arbeite an einem großen Projekt, das einen Logger zum Debuggen verwendet. Da ich gerne nachverfolgen möchte, was in einigen CUDA-Kerneln passiert, habe ich versucht, eine Möglichkeit zu finden, ...