Suchergebnisse für Anfrage "avx"
Wie führe ich eine elementweise Linksverschiebung mit __m128i durch?
Die SSE-Verschiebungsanweisungen, die ich gefunden habe, können bei allen Elementen nur um den gleichen Betrag verschoben werden:
Wie man __m256 horizontal summiert?
Ich möchte die Komponenten von a horizontal summieren
Beispiele und Tutorials für Intel SSE und AVX [geschlossen]
Gibt es gute C / C ++ - Tutorials oder Beispiele zum Erlernen von Intel SSE- und AVX-Anweisungen?Ich habe auf Microsoft MSDN- und Intel-Sites nur wenige gefu...
horizontale Summe von 8 gepackten 32-Bit-Floats
Wenn ich 8 gepackte 32-Bit-Gleitkommazahlen habe (
Streuen Sie Intrinsics in AVX
Ich kann sie im Intel Intrinsic Guide v2.7 nicht finden. Wissen Sie, ob AVX- oder AVX2-Befehlssätze diese unterstützen?
FLOPS pro Zyklus für Sandbrücke und Haswell SSE2 / AVX / AVX2
Ich bin verwirrt darüber, wie viele Flops pro Zyklus und Kern mit Sandy-Bridge und Haswell gemacht werden können. Wie ich es mit SSE verstehe, sollte es 4 Fl...
Verwendung der FMA-Anweisungen (Fused Multiply-Add) mit SSE / AVX
Ich habe gelernt, dass einige Intel / AMD-CPUs mit SSE / AVX simultan multiplizieren und addieren können:FLOPS pro Zyklus für Sandbrücke und Haswell SSE2 / A...
Leistung von SSE und AVX, wenn beide Speicherbandbreiten begrenzt sind
Im folgenden Code habe ich die "dataLen" geändert und unterschiedliche Effizienz erhalten.dataLen = 400 SSE-Zeit: 758000 us AVX-Zeit: 483000 us SSE...