Suchergebnisse für Anfrage "avx512"

2 die antwort

Wie erleichtern die Anweisungen zur Konflikterkennung das Vektorisieren von Schleifen?

Die AVX512CD-Befehlsfamilien sind: VPCONFLICT, VPLZCNT und VPBROADCASTM. Der Wikipedia-Abschnitt über diese Anleitung [https://en.wikipedia.org/wiki/AVX-512#New_instructions_in_AVX-512_conflict_detection] sagt: Die Anweisungen in der ...

2 die antwort

ingebettete Broadcasts mit Intrinsics und Assemb

In Abschnitt 2.5.3 "Broadcasts" vondie Programmierreferenz für Intel Architecture Instruction Set Extensions [https://software.intel.com/sites/default/files/managed/07/b7/319433-023.pdf] das lernen wir als AVX512 (und Knights Corner) hat in ...

2 die antwort

Horizontal hinzufügen mit __m512 (AVX512)

Wie führt man eine horizontale Addition mit Gleitkommazahlen in einem 512-Bit-AVX-Register effizient durch (dh addiert die Elemente aus einem einzelnen Vektor)? Für 128- und 256-Bit-Register kann dies mit _mm_hadd_ps und _mm256_hadd_ps erfolgen, ...

TOP-Veröffentlichungen

4 die antwort

Was sind in GNU C inline asm die Modifikatoren für xmm / ymm / zmm für einen einzelnen Operanden?

Während ich versuche zu antworteningebettete Broadcasts mit Intrinsics und Assemb [https://stackoverflow.com/questions/34415238/embedded-broadcasts-with-intrinsics-and-assembly] , Ich habe versucht, so etwas zu tun: __m512 mul_broad(__m512 a, ...

2 die antwort

Wie funktionieren die AVX512-Rundungsmodi (oder ist NDISASM einfach verwirrt)?

Ich versuche, die spezifische AVX512F-Anweisung zu verstehen. vcvtps2udq. Die Signatur der Anweisung lautetVCVTPS2UDQ zmm1 {k1}{z}, zmm2/m512/m32bcst{er}. Die manuellen Informationen finden Sie unten. eim Versuch, die neuen Rundungsmodi zu ...