Suchergebnisse für Anfrage "avx"

4 die antwort

Sortieren von 64-Bit-Strukturen mit AVX?

Ich habe eine 64-Bit-Struktur, die mehrere Datenelemente darstellt, von denen eines ein Gleitkommawert ist: struct MyStruct{ uint16_t a; uint16_t b; float f; }; und ich habe vier dieser Strukturen in, sagen wir einstd::array<MyStruct, 4> ist es ...

4 die antwort

Sind verschiedene mmx-, sse- und avx-Versionen komplementär oder übergeordnet?

Ich denke, ich sollte mich mit x86-SIMD-Erweiterungen vertraut machen. Aber bevor ich überhaupt angefangen habe, bin ich in Schwierigkeiten geraten. Ich kann keine gute Übersicht darüber finden, welche davon noch relevant sind. Die ...

4 die antwort

Wie schreibe ich C ++ - Code, den der Compiler effizient in SSE oder AVX kompilieren kann?

Nehmen wir an, ich habe eine in c ++ geschriebene Funktion, die Matrixvektormultiplikationen mit vielen Vektoren ausführt. Es wird ein Zeiger auf das zu transformierende Array von Vektoren benötigt. Kann ich zu Recht davon ausgehen, dass der ...

TOP-Veröffentlichungen

4 die antwort

Automatisches Generieren von FMA-Anweisungen in MSVC

MSVC unterstützt seit Jahren AVX / AVX2-Anweisungen und entsprichtdieser msdn-Blogbeitrag [http://blogs.msdn.com/b/vcblog/archive/2014/02/28/avx2-support-in-visual-studio-c-compiler.aspx] , es kann automatisch @ erzeug fused-multiply-add ...

4 die antwort

Die Indizes von Nicht-Null-Bytes eines SSE / AVX-Registers

Wenn der Wert eines SSE / AVX-Registers so ist, dass alle seine Bytes entweder 0 oder 1 sind, gibt es eine Möglichkeit, die Indizes aller Nicht-Null-Elemente effizient abzurufen? Zum Beispiel, wenn der xmm-Wert | ist r0 = 0 | r1 = 1 | r2 = 0 | ...

4 die antwort

Schneller Weg, um ein Array von int64_t zu multiplizieren?

Ich möchte die Multiplikation von zwei speicherausgerichteten Arrays vektorisieren. Ich habe keine Möglichkeit gefunden, 64 * 64-Bit in AVX / AVX2 zu multiplizieren, also habe ich nur das Loop-Unroll-Verfahren durchgeführt und AVX2 geladen / ...

4 die antwort

Was ist die Mindestversion von OS X für die Verwendung mit AVX / AVX2?

Ich habe eine Bildzeichnungsroutine, die mehrfach für SSE, SSE2, SSE3, SSE4.1, SSE4.2, AVX und AVX2 kompiliert wird. Mein Programm sendet dynamisch eine dieser binären Variationen, indem es die CPUID-Flags überprüft. nter Windows überprüfe ich ...

5 die antwort

SSE-Copy-, AVX-Copy- und STD :: Copy-Leistung

6 die antwort

praktisch BigNum AVX / SSE möglich?

SSE / AVX-Register können als Ganzzahl- oder Gleitkomma-BigNums angesehen werden. Das heißt, man könnte vernachlässigen, dass es überhaupt Fahrspuren gibt. Gibt es eine einfache Möglichkeit, diesen Standpunkt auszunutzen und diese Register ...

6 die antwort

Optimales uint8_t-Bitmap in einen 8 x 32-Bit-SIMD-Bool-Vektor

ls Teil eines Komprimierungsalgorithmus suche ich nach dem optimalen Weg, um Folgendes zu erreiche Ich habe eine einfache Bitmap in einemuint8_t. Zum Beispiel 01010011 Was ich will ist ein__m256i der Form: (0, maxint, 0, maxint, 0, 0, ...