Suchergebnisse für Anfrage "avx"

Diese Frage hat hier bereits eine Antwort: Wie überprüfe ich, ob eine CPU den SSE3-Befehlssatz unterstützt? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 Antworten CPU Dispatcher für Visual Studio für AVX und ...

x86 sse simd assembly

2 die antwort

Was sind die besten Befehlssequenzen, um Vektorkonstanten im laufenden Betrieb zu generieren?

"Best" bedeutet die wenigsten Anweisungen (oder die wenigsten Uops, wenn Anweisungen zu mehr als einem Uop decodieren). Die Größe des Maschinencodes in Bytes ist ein Leistungsmerkmal für die gleiche Anzahl von Eingaben. Konstante Generierung ...

c++intrinsics

4 die antwort

Sortieren von 64-Bit-Strukturen mit AVX?

Ich habe eine 64-Bit-Struktur, die mehrere Datenelemente darstellt, von denen eines ein Gleitkommawert ist: struct MyStruct{ uint16_t a; uint16_t b; float f; }; und ich habe vier dieser Strukturen in, sagen wir einstd::array<MyStruct, 4> ist es ...

TOP-Veröffentlichungen

The In-Depth Guide on Video Streaming Protocols [for non-tech founders]

Wie erstellt man eine Krypto-Tauschbörse?

c++avx2 sse simd

2 die antwort

Laden von 8 Zeichen aus dem Speicher in eine __m256-Variable als gepackte Gleitkommazahlen mit einfacher Genauigkeit

Ich optimiere einen Algorithmus für die Gaußsche Unschärfe in einem Bild und möchte die Verwendung eines Float-Puffers [8] im folgenden Code durch eine intrinsische Variable __m256 ersetzen. Welche Anweisungsreihe eignet sich am besten für diese ...

intel simd xor vectorization

2 die antwort

Unterschied zwischen den AVX-Anweisungen vxorpd und vpxor

Laut demIntel Intrinsics Guide [https://software.intel.com/sites/landingpage/IntrinsicsGuide/], vxorpd ymm, ymm, ymm: Berechnet das bitweise XOR gepackter Gleitkommaelemente mit doppelter Genauigkeit (64-Bit) in a und b und speichert die ...

sse c++simd c

6 die antwort

Sind ältere SIMD-Versionen verfügbar, wenn neuere verwendet werden?

Wenn ich SSE3 oder AVX nutzen kann, stehen dann ältere SSE-Versionen als SSE2 oder MMX zur Verfügung - oder muss ich immer noch separat nach ihnen suchen?

micro-optimization simd performance assembly

2 die antwort

Verwendung von SIMD / AVX / SSE zum Durchlaufen von Bäumen

Ich recherchiere gerade, ob es möglich ist, einen Baum von Van Emde Boas (oder einen Baum) schneller zu durchqueren. Bei einer einzelnen Suchabfrage als Eing...

c++simd intrinsics

2 die antwort

Intel SIMD - Wie kann ich überprüfen, ob ein __m256 * Werte ungleich Null enthält?

Ich verwende den Microsoft Visual Studio-Compiler. Ich versuche herauszufinden, ob ein 256-Bit-Vektor Werte ungleich Null enthält. Ich habe versuchtres_simd = ! _mm256_testz_ps(*pSrc1, *pSrc1); aber es funktioniert nicht

sum c++sse matrix

2 die antwort

Die effizienteste Methode, um m256 horizontale Summen von 8 m256 Quellvektoren zu erhalten

Ich weiß, wie man eins summiert__m256, um einen einzelnen summierten Wert zu erhalten. Ich habe jedoch 8 Vektoren wie Input 1: a[0], a[1], a[2], a[3], a[4], a[5], a[6], a[7], ....., ....., 8: h[0], h[1], h[2], h[3], h[4], a[5], a[6], ...

c++11 sse c++memory-alignment

6 die antwort

Wie löse ich das 32-Byte-Alignment-Problem für AVX-Lade- / Speichervorgänge?

Ich habe ein Ausrichtungsproblem bei der Verwendung vonymm registriert, mit ein paar Codefragmenten, die mir in Ordnung erscheinen. Hier ist ein minimales Arbeitsbeispiel: #include <iostream> #include <immintrin.h> inline void ones(float *a) { ...

Seite 1 von 6

12 3 4 5

Suchergebnisse für Anfrage "avx"

Überprüfen, ob SSE zur Laufzeit unterstützt wird [duplizieren]

Was sind die besten Befehlssequenzen, um Vektorkonstanten im laufenden Betrieb zu generieren?

Sortieren von 64-Bit-Strukturen mit AVX?

Beliebte Schlagwörter

TOP-Veröffentlichungen

Laden von 8 Zeichen aus dem Speicher in eine __m256-Variable als gepackte Gleitkommazahlen mit einfacher Genauigkeit

Unterschied zwischen den AVX-Anweisungen vxorpd und vpxor

Sind ältere SIMD-Versionen verfügbar, wenn neuere verwendet werden?

Verwendung von SIMD / AVX / SSE zum Durchlaufen von Bäumen

Intel SIMD - Wie kann ich überprüfen, ob ein __m256 * Werte ungleich Null enthält?

Die effizienteste Methode, um m256 horizontale Summen von 8 m256 Quellvektoren zu erhalten

Wie löse ich das 32-Byte-Alignment-Problem für AVX-Lade- / Speichervorgänge?

Du bist sehr aktiv! Es ist großartig!

Suchergebnisse für Anfrage "avx"

Beliebte Schlagwörter

TOP-Veröffentlichungen