Suchergebnisse für Anfrage "reduction"

2 die antwort

CUDA - Warum ist die verzerrungsbasierte Parallelreduktion langsamer?

Ich hatte die Idee einer Warp-basierten Parallelreduktion, da per Definition alle Threads eines Warps synchron sind.Die Idee war also, dass die Eingabedaten ...

1 die antwort

CUDA-Array-Reduzierung

4 die antwort

OpenCL-Verkleinerungsergebnis bei großen Floats falsch

Ich benutzteeispiel für die zweistufige Reduzierung von A [http://developer.amd.com/resources/documentation-articles/articles-whitepapers/opencl-optimization-case-study-simple-reductions/] , um die Summe aller Zahlen von 0 bis 65 536 mit ...

TOP-Veröffentlichungen

1 die antwort

CUDA: In Warp Reduction und Volatile Keyword

Nach dem Lesen der Frage und ihrer Antwort aus dem Folgenden VERKNÜPFUNG [https://stackoverflow.com/questions/12733084/cuda-why-is-warp-based-parallel-reduction-slower] Ich habe noch eine Frage im Kopf. Aus meinem Hintergrund in C / C ++; ...

10 die antwort

Ist es möglich ein Array mit openmp zu verkleinern?

Unterstützt OpenMP nativ die Reduzierung einer Variablen, die ein Array darstellt? Dies würde in etwa wie folgt funktionieren ... float* a = (float*) calloc(4*sizeof(float)); omp_set_num_threads(13); #pragma omp parallel reduction(+:a) ...

2 die antwort

Warum wird eine eingebaute Funktion auf zu wenige Argumente angewendet, die als schwache Normalform gelten?

Der HaskellDefinition [http://www.haskell.org/haskellwiki/Weak_head_normal_form] sagt: Ein Ausdruck hat die Normalform eines schwachen Kopfes (WHNF), wenn es sich um Folgendes handelt: ein Konstruktor (eventuell angewendet auf Argumente) wie ...

2 die antwort

Maximum der Matrix in CUDA finden

Ich habe gerade in CUDA angefangen. Jetzt habe ich eine Frage. Ich habe eine N * N-Matrix und eine Fensterskala von 8x8. Ich möchte diese Matrix in mehrere Untermatrizen unterteilen und den Maximalwert dafür finden. Wenn ich zum Beispiel eine 64 ...

2 die antwort

Ausführungsreihenfolge im Reduktionsbetrieb in OpenMP

Gibt es eine Möglichkeit, die Ausführungsreihenfolge für einen Reduktionsoperator in OpenMP zu kennen? Mit anderen Worten, ich möchte wissen, wie die Threads...

2 die antwort

Wie finde ich die Summe des Arrays in CUDA durch Reduktion

Ich implementiere eine Funktion, um die Summe eines Arrays mit Hilfe der Reduktion zu ermitteln. Mein Array hat 32 * 32 Elemente und seine Werte sind 0 ... 1023. Der erwartete Summenwert ist 523776, aber das Ergebnis ist 15872 falsch. Hier ist ...

3 die antwort

Array-Reduzierung in OpenMP

Ich versuche, das folgende Programm zu parallelisieren, weiß aber nicht, wie ich ein Array reduzieren soll. Ich weiß, dass dies nicht möglich ist, aber gibt ...