Suchergebnisse für Anfrage "simd"

6 die antwort

Optimales uint8_t-Bitmap in einen 8 x 32-Bit-SIMD-Bool-Vektor

ls Teil eines Komprimierungsalgorithmus suche ich nach dem optimalen Weg, um Folgendes zu erreiche Ich habe eine einfache Bitmap in einemuint8_t. Zum Beispiel 01010011 Was ich will ist ein__m256i der Form: (0, maxint, 0, maxint, 0, 0, ...

2 die antwort

Intel SIMD - Wie kann ich überprüfen, ob ein __m256 * Werte ungleich Null enthält?

Ich verwende den Microsoft Visual Studio-Compiler. Ich versuche herauszufinden, ob ein 256-Bit-Vektor Werte ungleich Null enthält. Ich habe versuchtres_simd = ! _mm256_testz_ps(*pSrc1, *pSrc1); aber es funktioniert nicht

4 die antwort

Überprüfen, ob SSE zur Laufzeit unterstützt wird [duplizieren]

Diese Frage hat hier bereits eine Antwort: Wie überprüfe ich, ob eine CPU den SSE3-Befehlssatz unterstützt? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 Antworten CPU Dispatcher für Visual Studio für AVX und ...

TOP-Veröffentlichungen

12 die antwort

C ++ 2 Arrays schnell zusammenfügen

Gegeben die Arrays: int canvas[10][10]; int addon[10][10];Wo alle Werte zwischen 0 und 100 liegen,Was ist der schnellste Weg in C ++, um diese beiden Arrays zu addieren, sodass jede Zelle im Canvas-Bereich sich selbst plus dem entsprechenden ...

2 die antwort

CUDA: Vermeiden der seriellen Ausführung bei Verzweigungsdivergenz

Angenommen, ein CUDA-Kernel, der von einem einzelnen Warp ausgeführt wird (der Einfachheit halber), erreicht einif-else Anweisung, bei der 20 der Threads innerhalb des Warps @ erfüllcondition und 32 - 20 = 12 Threads nicht: if (condition){ ...

6 die antwort

Sind ältere SIMD-Versionen verfügbar, wenn neuere verwendet werden?

Wenn ich SSE3 oder AVX nutzen kann, stehen dann ältere SSE-Versionen als SSE2 oder MMX zur Verfügung - oder muss ich immer noch separat nach ihnen suchen?

4 die antwort

SIMD-Ausrichtungsproblem mit PPL Combinable

Ich versuche, die Elemente des Arrays parallel zu SIMD zu summieren. Um Sperren zu vermeiden, verwende ich kombinierbaren Thread local, der nicht immer auf 16 Bytes ausgerichtet ist, da _mm_add_epi32 eine Ausnahme ...

6 die antwort

C ++ - Fehler: "_mm_sin_ps" wurde in diesem Bereich nicht deklariert.

Ich versuche, verschiedene Methoden zum Anwenden einer Funktion auf ein Array zu vergleichen. warum ...

2 die antwort

Warum optimieren GCC oder Clang bei Verwendung von fast-math nicht den Kehrwert von 1 Anweisung?

Weiß jemand, warum GCC / Clang nicht optimistisch funktionieren wird test1 im folgenden Codebeispiel, um bei Verwendung der Option fast-math einfach nur den RCPPS-Befehl zu verwenden? Gibt es ein anderes Compiler-Flag, das diesen Code erzeugen ...

6 die antwort

Wie verwende ich die Multiplikation und Akkumulation von Intrinsics in ARM Cortex-a8?

Wie verwende ich die von GCC bereitgestellten Multiplikations-Akkumulations-Eigenschaften? float32x4_t vmlaq_f32 (float32x4_t , float32x4_t , float32x4_t);Kann mir jemand erklären, welche drei Parameter ich an diese Funktion übergeben muss. Ich ...