Suchergebnisse für Anfrage "avx"
L1 Speicherbandbreite: 50% Wirkungsgradverlust bei Adressen, die sich um 4096 + 64 Bytes unterscheiden
Ich möchte die maximale Bandbreite der folgenden Vorgänge mit Intel-Prozessoren erreichen. for(int i=0; i<n; i++) z[i] = x[i] + y[i]; //n=2048wobei x, y und z Float-Arrays sind. Ich mache das auf Haswell-, Ivy Bridge- und Westmere-Systemen. Ich ...
sind statische / statische lokale SSE / AVX-Variablen, die ein xmm / ymm-Register blockieren?
Bei Verwendung von SSE-Intrinsics sind häufig Nullvektoren erforderlich. Eine Möglichkeit, die Erstellung einer Nullvariablen innerhalb einer Funktion zu vermeiden, wenn die Funktion aufgerufen wird (jedes Mal, wenn effektiv ...
Unterschied zwischen den AVX-Anweisungen vxorpd und vpxor
Laut demIntel Intrinsics Guide [https://software.intel.com/sites/landingpage/IntrinsicsGuide/], vxorpd ymm, ymm, ymm: Berechnet das bitweise XOR gepackter Gleitkommaelemente mit doppelter Genauigkeit (64-Bit) in a und b und speichert die ...
unresolved external symbol __mm256_setr_epi64x
Ich habe AVX-Code mit g ++ geschrieben und debuggt und versuche jetzt, ihn mit MSVC zum Laufen zu bringen, aber ich bekomme immer wieder error LNK2019: nicht aufgelöstes externes Symbol __mm256_setr_epi64x, auf das in der Funktion "private: ...
Schnellste 64-Bit-Bevölkerungszahl (Hamming-Gewicht)
Ich musste das Hamming-Gewicht für einen recht schnellen kontinuierlichen Fluss von 64-Bit-Daten berechnen und das @ verwendepopcnt Montageanleitung wirft mir eine Ausnahme von meinem Intel Core i7-4650U. Ich habe die Freude meines Bibel-Hackers ...
praktisch BigNum AVX / SSE möglich?
SSE / AVX-Register können als Ganzzahl- oder Gleitkomma-BigNums angesehen werden. Das heißt, man könnte vernachlässigen, dass es überhaupt Fahrspuren gibt. Gibt es eine einfache Möglichkeit, diesen Standpunkt auszunutzen und diese Register ...
Optimales uint8_t-Bitmap in einen 8 x 32-Bit-SIMD-Bool-Vektor
ls Teil eines Komprimierungsalgorithmus suche ich nach dem optimalen Weg, um Folgendes zu erreiche Ich habe eine einfache Bitmap in einemuint8_t. Zum Beispiel 01010011 Was ich will ist ein__m256i der Form: (0, maxint, 0, maxint, 0, 0, ...
Intel SIMD - Wie kann ich überprüfen, ob ein __m256 * Werte ungleich Null enthält?
Ich verwende den Microsoft Visual Studio-Compiler. Ich versuche herauszufinden, ob ein 256-Bit-Vektor Werte ungleich Null enthält. Ich habe versuchtres_simd = ! _mm256_testz_ps(*pSrc1, *pSrc1); aber es funktioniert nicht
Überprüfen, ob SSE zur Laufzeit unterstützt wird [duplizieren]
Diese Frage hat hier bereits eine Antwort: Wie überprüfe ich, ob eine CPU den SSE3-Befehlssatz unterstützt? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 Antworten CPU Dispatcher für Visual Studio für AVX und ...
Sind ältere SIMD-Versionen verfügbar, wenn neuere verwendet werden?
Wenn ich SSE3 oder AVX nutzen kann, stehen dann ältere SSE-Versionen als SSE2 oder MMX zur Verfügung - oder muss ich immer noch separat nach ihnen suchen?