Suchergebnisse für Anfrage "cuda"
Gibt es eine Möglichkeit, Sincos-Anrufe in CUDA zu optimieren?
Ich schreibe ein Programm in CUDA, das eine große Menge von Aufrufen an diesincos() -Funktion mit doppelter Genauigkeit. Ich fürchte, dies ist einer der größten Engpässe im Code, und ich kann die Anzahl der Aufrufe der Funktion ...
Template- und Constexpr-Abzug zur Kompilierungszeit abhängig von Compiler- und Optimierungs-Flags
Die folgende Frage ist aus einem viel größeren Code zusammengefasst. Daher scheinen einige Ausdrücke übertrieben oder unnötig zu sein, sind jedoch für den ursprünglichen Code von entscheidender Bedeutung. Consider mit einer Struktur, die ...
Wie kompiliere ich die CUDA-App für Visual Studio 2010?
Wie kompiliere ich die CUDA-App für Visual Studio 2010? Hier sind meine Schritte: 1. Leeres C ++ - Projekt ohne vorkompilierte Header erstellen 2. main.cpp hinzufügen int main() { return 0; } Add kernels.cu Ich habe auf das Beispielprojekt ...
Trouble Generierung von Primzahlen mit CUDA
Ich werde nur mit Cuda angestarrt, und nachdem ich die Vektorsummen-Tutorials durchgesehen habeHie [https://www.nvidia.com/docs/IO/116711/sc11-cuda-c-basics.pdf] Ich dachte, ich würde etwas von Grund auf versuchen, um meine Beine wirklich unter ...
Interpretation von "zu viele Ressourcen für den Start"
Betrachten Sie den folgenden Python-Code: from numpy import float64 from pycuda import compiler, gpuarray import pycuda.autoinit # N > 960 is crucial! N = 961 code = """ __global__ void kern(double *v) { double a = v[0]*v[2]; double lmax = ...
Kann keinen CUDA-Code in VS 2015 kompilieren
Ich habe vor kurzem das @ installieCuda 8.0 Toolkit [https://developer.nvidia.com/cuda-downloads] in meinem Windows 10-Desktop (nach dem Entfernen aller v7.5-Komponenten). Obwohl frühere Versionen mit Visual Studio 2015 nicht kompatibel waren, ...
Wie kann man den konstanten CUDA-Speicher auf angenehme Weise programmieren?
Ich arbeite an einer App zur Zahlenkalkulation mit dem CUDA-Framework. Ich habe einige statische Daten, auf die alle Threads zugreifen können sollten, also habe ich sie wie folgt in einen konstanten Speicher gestellt: __device__ __constant__ ...
Aus einem nicht ausgerichteten uint8_t-Recast als uint32_t-Array lesen - nicht alle Werte abrufen
Ich versuche, ein uint8_t-Array in ein uint32_t-Array umzuwandeln. Wenn ich dies versuche, kann ich jedoch nicht auf alle aufeinander folgenden 4 Bytes zugreifen. Sagen wir, ich habe ein uint8_t-Array mit 8 Bytes. Ich möchte auf Byte 2 -> ...
MySQL Implementierung mit CUDA
Ich bin ein Senior Undergrad mit Schwerpunkt CS. Im Moment nehme ich an einem Computer Architektur Kurs teil. Wir müssen ein Projekt machen. Ich möchte etwas im Zusammenhang mit CUDA tun, bei dem die Leistung der Berechnung im Vergleich zu einer ...
Wie kann ich mit Visual Studio 2008 in CUDA-Kernel-Code debuggen?
Hey, ich verwende Visual Studio 2008 mit CUDA 3.2. Ich versuche, in eine Funktion mit dieser Signatur zu debuggen: MatrixMultiplication_Kernel<<<dimGrid, dimBlock>>>(Md, Nd, Pd, Width);Ich kann in die Funktion eintreten, aber wenn ich in die ...