Suchergebnisse für Anfrage "cuda"

4 die antwort

Kann ich mit OpenCL Gerätespeicher zuweisen und Zeiger auf den Speicher in CUDA verwenden?

Say Ich verwende OpenCL zur Speicherverwaltung (sodass die Speicherverwaltung zwischen GPU / CPU denselben Code verwendet), aber meine Berechnung verwendet optimierten CUDA- und CPU-Code (nicht OpenCL). Kann ich die OpenCL-Gerätespeicherzeiger ...

2 die antwort

Sortieren gepackter Eckpunkte mit Schub

So habe ich ein Geräte-Array mit PackedVertex-Strukturen: struct PackedVertex { glm::vec3 Vertex; glm::vec2 UV; glm::vec3 Normal; } Ich versuche, sie so zu sortieren, dass Duplikate im Array zusammengefasst werden. Die Gesamtreihenfolge ...

8 die antwort

CUDA-Verknüpfungsfehler - Visual Express 2008 - nvcc wegen (Null-) Konfigurationsdatei fatal

Ich habe in den letzten 2 Wochen intensiv nach einer möglichen Lösung für meinen Fehler gesucht. Ich habe den Cuda 64-Bit-Compiler (Tools) und das SDK sowie die 64-Bit-Version von Visual Studio Express 2008 und Windows 7 SDK mit Framework 3.5 ...

TOP-Veröffentlichungen

2 die antwort

getrs Funktion von cuSolver über Pycuda funktioniert nicht richtig

Ich versuche, einen Pycuda-Wrapper zu erstellen, der von der scikits-cuda-Bibliothek für einige Operationen in der neuen cuSolver-Bibliothek von Nvidia inspiriert ist. Ich möchte ein lineares System der Form AX = B durch LU-Faktorisierung lösen, ...

2 die antwort

CUDA: Vermeiden der seriellen Ausführung bei Verzweigungsdivergenz

Angenommen, ein CUDA-Kernel, der von einem einzelnen Warp ausgeführt wird (der Einfachheit halber), erreicht einif-else Anweisung, bei der 20 der Threads innerhalb des Warps @ erfüllcondition und 32 - 20 = 12 Threads nicht: if (condition){ ...

2 die antwort

Speicherzuordnung auf der GPU für dynamisches Array von Strukturen

Ich habe ein Problem mit der Übergabe eines Arrays von struct an den GPU-Kernel. Ich basierend auf diesem Thema -cudaMemcpy Segmentierungsfehler [https://stackoverflow.com/questions/15431365/cudamemcpy-segmentation-fault] und ich habe etw so ...

2 die antwort

Template __host__ __device__ ruft vom Host definierte Funktionen auf

Während der Implementierung von CUDA-Code benötige ich häufig einige Dienstprogrammfunktionen, die sowohl vom Gerät als auch vom Host-Code aufgerufen werden. Also deklariere ich diese Funktionen als__host__ __device __. Dies ist in Ordnung und ...

2 die antwort

Integer min / max in CUDA

Ich sehe in derCUDA Math API [http://docs.nvidia.com/cuda/cuda-math-api/group__CUDA__MATH__SINGLE.html#group__CUDA__MATH__SINGLE_1gef4476ab1d2818b60097fdc4064a395a] Dokumentation, dass es Funktionen für Min / Max-Operationen mit einfacher ...

8 die antwort

CUDA: Umbrechen der Gerätespeicherzuordnung in C ++

Ich fange gerade an, CUDA zu verwenden und muss zugeben, dass ich von der C-API etwas enttäuscht bin. Ich verstehe die Gründe für die Wahl von C, aber wenn die Sprache stattdessen auf C ++ basiert hätte, wären einige Aspekte viel ...

4 die antwort

CUDA-Thread-Ausführungsreihenfolge

Ich habe den folgenden Code für ein CUDA-Programm: #include <stdio.h> #define NUM_BLOCKS 4 #define THREADS_PER_BLOCK 4 __global__ void hello() { printf("Hello. I'm a thread %d in block %d\n", threadIdx.x, blockIdx.x); } int main(int argc,char ...