Suchergebnisse für Anfrage "reduction"

10 die antwort

Ist es möglich ein Array mit openmp zu verkleinern?

Unterstützt OpenMP nativ die Reduzierung einer Variablen, die ein Array darstellt? Dies würde in etwa wie folgt funktionieren ... float* a = (float*) calloc(4*sizeof(float)); omp_set_num_threads(13); #pragma omp parallel reduction(+:a) ...

2 die antwort

Maximum der Matrix in CUDA finden

Ich habe gerade in CUDA angefangen. Jetzt habe ich eine Frage. Ich habe eine N * N-Matrix und eine Fensterskala von 8x8. Ich möchte diese Matrix in mehrere Untermatrizen unterteilen und den Maximalwert dafür finden. Wenn ich zum Beispiel eine 64 ...

2 die antwort

CUDA - Warum ist die verzerrungsbasierte Parallelreduktion langsamer?

Ich hatte die Idee einer Warp-basierten Parallelreduktion, da per Definition alle Threads eines Warps synchron sind.Die Idee war also, dass die Eingabedaten ...

TOP-Veröffentlichungen

1 die antwort

CUDA-Array-Reduzierung

2 die antwort

Warum wird eine eingebaute Funktion auf zu wenige Argumente angewendet, die als schwache Normalform gelten?

Der HaskellDefinition [http://www.haskell.org/haskellwiki/Weak_head_normal_form] sagt: Ein Ausdruck hat die Normalform eines schwachen Kopfes (WHNF), wenn es sich um Folgendes handelt: ein Konstruktor (eventuell angewendet auf Argumente) wie ...

2 die antwort

BMP-Bild in einen Befehlssatz für einen Plotter konvertieren?

Ich habe einen Plotter wie diesen: [/imgs/YEr1F.jpg] Die Aufgabe, die ich ausführen muss, ist die Konvertierung von 24-Bit-BMP in einen Befehlssatz für diesen Plotter. Im Plotter kann ich 16 gängige Farben ändern. Die erste Komplexität, der ich ...

2 die antwort

Wie finde ich die Summe des Arrays in CUDA durch Reduktion

Ich implementiere eine Funktion, um die Summe eines Arrays mit Hilfe der Reduktion zu ermitteln. Mein Array hat 32 * 32 Elemente und seine Werte sind 0 ... 1023. Der erwartete Summenwert ist 523776, aber das Ergebnis ist 15872 falsch. Hier ist ...

1 die antwort

CUDA: In Warp Reduction und Volatile Keyword

Nach dem Lesen der Frage und ihrer Antwort aus dem Folgenden VERKNÜPFUNG [https://stackoverflow.com/questions/12733084/cuda-why-is-warp-based-parallel-reduction-slower] Ich habe noch eine Frage im Kopf. Aus meinem Hintergrund in C / C ++; ...

3 die antwort

Array-Reduzierung in OpenMP

Ich versuche, das folgende Programm zu parallelisieren, weiß aber nicht, wie ich ein Array reduzieren soll. Ich weiß, dass dies nicht möglich ist, aber gibt ...

2 die antwort

CUDA-Schub: Reduziere_durch_Taste auf nur einige Werte in einem Array, basierend auf Werten in einem "Schlüssel" -Array

Nehmen wir an, ich habe zwei device_vector <byte> -Arrays.