Suchergebnisse für Anfrage "avx"

2 die antwort

L1 Speicherbandbreite: 50% Wirkungsgradverlust bei Adressen, die sich um 4096 + 64 Bytes unterscheiden

Ich möchte die maximale Bandbreite der folgenden Vorgänge mit Intel-Prozessoren erreichen. for(int i=0; i<n; i++) z[i] = x[i] + y[i]; //n=2048wobei x, y und z Float-Arrays sind. Ich mache das auf Haswell-, Ivy Bridge- und Westmere-Systemen. Ich ...

4 die antwort

sind statische / statische lokale SSE / AVX-Variablen, die ein xmm / ymm-Register blockieren?

Bei Verwendung von SSE-Intrinsics sind häufig Nullvektoren erforderlich. Eine Möglichkeit, die Erstellung einer Nullvariablen innerhalb einer Funktion zu vermeiden, wenn die Funktion aufgerufen wird (jedes Mal, wenn effektiv ...

2 die antwort

Unterschied zwischen den AVX-Anweisungen vxorpd und vpxor

Laut demIntel Intrinsics Guide [https://software.intel.com/sites/landingpage/IntrinsicsGuide/], vxorpd ymm, ymm, ymm: Berechnet das bitweise XOR gepackter Gleitkommaelemente mit doppelter Genauigkeit (64-Bit) in a und b und speichert die ...

TOP-Veröffentlichungen

4 die antwort

unresolved external symbol __mm256_setr_epi64x

Ich habe AVX-Code mit g ++ geschrieben und debuggt und versuche jetzt, ihn mit MSVC zum Laufen zu bringen, aber ich bekomme immer wieder error LNK2019: nicht aufgelöstes externes Symbol __mm256_setr_epi64x, auf das in der Funktion "private: ...

4 die antwort

Schnellste 64-Bit-Bevölkerungszahl (Hamming-Gewicht)

Ich musste das Hamming-Gewicht für einen recht schnellen kontinuierlichen Fluss von 64-Bit-Daten berechnen und das @ verwendepopcnt Montageanleitung wirft mir eine Ausnahme von meinem Intel Core i7-4650U. Ich habe die Freude meines Bibel-Hackers ...

6 die antwort

praktisch BigNum AVX / SSE möglich?

SSE / AVX-Register können als Ganzzahl- oder Gleitkomma-BigNums angesehen werden. Das heißt, man könnte vernachlässigen, dass es überhaupt Fahrspuren gibt. Gibt es eine einfache Möglichkeit, diesen Standpunkt auszunutzen und diese Register ...

6 die antwort

Optimales uint8_t-Bitmap in einen 8 x 32-Bit-SIMD-Bool-Vektor

ls Teil eines Komprimierungsalgorithmus suche ich nach dem optimalen Weg, um Folgendes zu erreiche Ich habe eine einfache Bitmap in einemuint8_t. Zum Beispiel 01010011 Was ich will ist ein__m256i der Form: (0, maxint, 0, maxint, 0, 0, ...

2 die antwort

Intel SIMD - Wie kann ich überprüfen, ob ein __m256 * Werte ungleich Null enthält?

Ich verwende den Microsoft Visual Studio-Compiler. Ich versuche herauszufinden, ob ein 256-Bit-Vektor Werte ungleich Null enthält. Ich habe versuchtres_simd = ! _mm256_testz_ps(*pSrc1, *pSrc1); aber es funktioniert nicht

4 die antwort

Überprüfen, ob SSE zur Laufzeit unterstützt wird [duplizieren]

Diese Frage hat hier bereits eine Antwort: Wie überprüfe ich, ob eine CPU den SSE3-Befehlssatz unterstützt? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 Antworten CPU Dispatcher für Visual Studio für AVX und ...

6 die antwort

Sind ältere SIMD-Versionen verfügbar, wenn neuere verwendet werden?

Wenn ich SSE3 oder AVX nutzen kann, stehen dann ältere SSE-Versionen als SSE2 oder MMX zur Verfügung - oder muss ich immer noch separat nach ihnen suchen?