Suchergebnisse für Anfrage "cuda"

1 die antwort

Gestapelte FFTs mit cufftPlanMany

Ich möchte auftreten441 2D,32-by-32 FFTs mit der Stapelmethode, die von der cuFFT-Bibliothek bereitgestellt wird. Die Parameter der Transformation sind folgende: int n[2] = {32,32}; int inembed[] = {32,32}; int onembed[] = ...

1 die antwort

Wie kann ich das Projekt in Eclipse-nsight erstellen, das sowohl Intel C ++ als auch CUDA C ++ verwendet?

Ich möchte ICC (Intel C ++ Compiler) mit CUDA NVCC (nVidia C ++ Compiler) unter Linux in Eclipse-nsight verwenden. ich installierteCUDA 5.5 mit Eclipse-nsight [https://developer.nvidia.com/cuda-downloads]undIntel Cluster Studio 2013 ...

1 die antwort

Segmentierungsfehler beim Übergeben des Gerätezeigers an cublasSnrm2

Der folgende Code von cublas gibt uns die Fehler: core dumped während "cublasSnrm2 (handle, row, dy, incy, de)", könnten Sie einen Rat geben? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" #include "helper_cuda.h" using ...

TOP-Veröffentlichungen

1 die antwort

cudaMallocManaged () gibt "Operation nicht unterstützt" zurück

Das Ausprobieren von verwaltetem Speicher in CUDA 6.0 gibt miroperation not supported beim anrufencudaMallocManaged(). #include "cuda_runtime.h" #include <stdio.h> #define CHECK(r) {_check((r), __LINE__);} void _check(cudaError_t r, int line) { ...

2 die antwort

Arrays von Strukturen in CUDA sortieren

Ich habe einen Laptop mit einer NVIDIA GT750M 4Gb (Compute Capability 3.0) Grafikkarte. Ich muss ein Array von Strukturen nach CUDA sortieren (ungefähr 3 × 10 ^ 7 Elemente). Aber ich kann nicht herausfinden wie, da ich nicht genug Erfahrung mit ...

2 die antwort

Wie führe ich Multiplikationen mit mehreren Matrizen in CUDA durch?

Ich habe eine Reihe von quadratischen Matrizenint *M[10]; damitM[i] Findet das erste Element voni-te Matrix. Ich möchte alle Matrizen multiplizierenM[i] durch eine andere MatrixN, so dass ich eine Reihe von quadratischen Matrizen erhalteint ...

2 die antwort

Grundlegendes zu CUDA-Rastermaßen, Blockmaßen und Thread-Organisation (einfache Erklärung) [geschlossen]

Wie werden Threads so organisiert, dass sie von einer GPU ausgeführt werden?

1 die antwort

CUDA Math API: Unterschied zwischen Funktionen und Eigenheiten

LautCUDA Mathe APi [http://docs.nvidia.com/cuda/cuda-math-api/]Viele mathematische Funktionen wie Sinus und Cosinus sind sowohl in Software (Funktionen) als auch in Hardware (Intrinsics) implementiert. Diese Eigenheiten verwenden wahrscheinlich ...

1 die antwort

Beispiel für die Erhöhung der Arbeit pro Thread in CUDA

Algorithmus : Ich schreibe ein Programm mit CUDA und das Problem ist folgendes: Zwei Matrizen A (n * 128) und B (m * 128) Ich nehme die erste Reihe von A und berechne nacheinander den Abstand zwischen diesem Vektor und allen Reihen von B. Ich ...

2 die antwort

Grafikalgorithmen auf GPU

Die aktuellen GPU-Threads sind irgendwie begrenzt (Speicherbegrenzung, Begrenzung der Datenstrukturen, keine Rekursion ...). Halten Sie es für möglich, ein Problem der Graphentheorie auf der GPU zu implementieren? Zum Beispiel Vertex Cover? ...