Suchergebnisse für Anfrage "avx"

3 die antwort

Wie führe ich eine elementweise Linksverschiebung mit __m128i durch?

Die SSE-Verschiebungsanweisungen, die ich gefunden habe, können bei allen Elementen nur um den gleichen Betrag verschoben werden:

3 die antwort

Ist _mm_broadcast_ss schneller als _mm_set1_ps?

Ist dieser Code

2 die antwort

Wie man __m256 horizontal summiert?

Ich möchte die Komponenten von a horizontal summieren

TOP-Veröffentlichungen

4 die antwort

Beispiele und Tutorials für Intel SSE und AVX [geschlossen]

Gibt es gute C / C ++ - Tutorials oder Beispiele zum Erlernen von Intel SSE- und AVX-Anweisungen?Ich habe auf Microsoft MSDN- und Intel-Sites nur wenige gefu...

4 die antwort

horizontale Summe von 8 gepackten 32-Bit-Floats

Wenn ich 8 gepackte 32-Bit-Gleitkommazahlen habe (

2 die antwort

Streuen Sie Intrinsics in AVX

Ich kann sie im Intel Intrinsic Guide v2.7 nicht finden. Wissen Sie, ob AVX- oder AVX2-Befehlssätze diese unterstützen?

2 die antwort

FLOPS pro Zyklus für Sandbrücke und Haswell SSE2 / AVX / AVX2

Ich bin verwirrt darüber, wie viele Flops pro Zyklus und Kern mit Sandy-Bridge und Haswell gemacht werden können. Wie ich es mit SSE verstehe, sollte es 4 Fl...

2 die antwort

Verwendung der FMA-Anweisungen (Fused Multiply-Add) mit SSE / AVX

Ich habe gelernt, dass einige Intel / AMD-CPUs mit SSE / AVX simultan multiplizieren und addieren können:FLOPS pro Zyklus für Sandbrücke und Haswell SSE2 / A...

5 die antwort

SSE-Copy-, AVX-Copy- und STD :: Copy-Leistung

2 die antwort

Leistung von SSE und AVX, wenn beide Speicherbandbreiten begrenzt sind

Im folgenden Code habe ich die "dataLen" geändert und unterschiedliche Effizienz erhalten.dataLen = 400 SSE-Zeit: 758000 us AVX-Zeit: 483000 us SSE...