Suchergebnisse für Anfrage "avx"

4 die antwort

Überprüfen, ob SSE zur Laufzeit unterstützt wird [duplizieren]

Diese Frage hat hier bereits eine Antwort: Wie überprüfe ich, ob eine CPU den SSE3-Befehlssatz unterstützt? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 Antworten CPU Dispatcher für Visual Studio für AVX und ...

2 die antwort

Was sind die besten Befehlssequenzen, um Vektorkonstanten im laufenden Betrieb zu generieren?

"Best" bedeutet die wenigsten Anweisungen (oder die wenigsten Uops, wenn Anweisungen zu mehr als einem Uop decodieren). Die Größe des Maschinencodes in Bytes ist ein Leistungsmerkmal für die gleiche Anzahl von Eingaben. Konstante Generierung ...

4 die antwort

Sortieren von 64-Bit-Strukturen mit AVX?

Ich habe eine 64-Bit-Struktur, die mehrere Datenelemente darstellt, von denen eines ein Gleitkommawert ist: struct MyStruct{ uint16_t a; uint16_t b; float f; }; und ich habe vier dieser Strukturen in, sagen wir einstd::array<MyStruct, 4> ist es ...

TOP-Veröffentlichungen

2 die antwort

Laden von 8 Zeichen aus dem Speicher in eine __m256-Variable als gepackte Gleitkommazahlen mit einfacher Genauigkeit

Ich optimiere einen Algorithmus für die Gaußsche Unschärfe in einem Bild und möchte die Verwendung eines Float-Puffers [8] im folgenden Code durch eine intrinsische Variable __m256 ersetzen. Welche Anweisungsreihe eignet sich am besten für diese ...

2 die antwort

Unterschied zwischen den AVX-Anweisungen vxorpd und vpxor

Laut demIntel Intrinsics Guide [https://software.intel.com/sites/landingpage/IntrinsicsGuide/], vxorpd ymm, ymm, ymm: Berechnet das bitweise XOR gepackter Gleitkommaelemente mit doppelter Genauigkeit (64-Bit) in a und b und speichert die ...

6 die antwort

Sind ältere SIMD-Versionen verfügbar, wenn neuere verwendet werden?

Wenn ich SSE3 oder AVX nutzen kann, stehen dann ältere SSE-Versionen als SSE2 oder MMX zur Verfügung - oder muss ich immer noch separat nach ihnen suchen?

2 die antwort

Verwendung von SIMD / AVX / SSE zum Durchlaufen von Bäumen

Ich recherchiere gerade, ob es möglich ist, einen Baum von Van Emde Boas (oder einen Baum) schneller zu durchqueren. Bei einer einzelnen Suchabfrage als Eing...

2 die antwort

Intel SIMD - Wie kann ich überprüfen, ob ein __m256 * Werte ungleich Null enthält?

Ich verwende den Microsoft Visual Studio-Compiler. Ich versuche herauszufinden, ob ein 256-Bit-Vektor Werte ungleich Null enthält. Ich habe versuchtres_simd = ! _mm256_testz_ps(*pSrc1, *pSrc1); aber es funktioniert nicht

2 die antwort

Die effizienteste Methode, um __m256 horizontale Summen von 8 __m256 Quellvektoren zu erhalten

Ich weiß, wie man eins summiert__m256, um einen einzelnen summierten Wert zu erhalten. Ich habe jedoch 8 Vektoren wie Input 1: a[0], a[1], a[2], a[3], a[4], a[5], a[6], a[7], ....., ....., 8: h[0], h[1], h[2], h[3], h[4], a[5], a[6], ...

6 die antwort

Wie löse ich das 32-Byte-Alignment-Problem für AVX-Lade- / Speichervorgänge?

Ich habe ein Ausrichtungsproblem bei der Verwendung vonymm registriert, mit ein paar Codefragmenten, die mir in Ordnung erscheinen. Hier ist ein minimales Arbeitsbeispiel: #include <iostream> #include <immintrin.h> inline void ones(float *a) { ...