Suchergebnisse für Anfrage "avx"

2 die antwort

AVX2, Wie kann man effizient vier Ganzzahlen in gerade Indizes eines 256-Bit-Registers laden und in ungerade Indizes kopieren?

Ich habe ein ausgerichtetes Array von Ganzzahlen im Speicher, das die Indizes I0, I1, I2, I3 enthält. Mein Ziel ist es, sie in ein __m256i-Register zu bringen, das I0, I0 + 1, I1, I1 + 1, I2, I2 + 1, I3, I3 + 1 enthält. Der schwierige Teil ...

2 die antwort

Verschiebung von 4 ganzen Zahlen nach rechts um verschiedene Werte SIMD

SSE bietet keine Möglichkeit, gepackte ganze Zahlen um einen variablen Betrag zu verschieben (ich kann alle Anweisungen von AVX und älter verwenden). Du kannst nur gleichmäßige Schichten machen. Das Ergebnis, das ich für jede ganze Zahl im Vektor ...

4 die antwort

Was ist die Mindestversion von OS X für die Verwendung mit AVX / AVX2?

Ich habe eine Bildzeichnungsroutine, die mehrfach für SSE, SSE2, SSE3, SSE4.1, SSE4.2, AVX und AVX2 kompiliert wird. Mein Programm sendet dynamisch eine dieser binären Variationen, indem es die CPUID-Flags überprüft. nter Windows überprüfe ich ...

TOP-Veröffentlichungen