Resultados de la búsqueda a petición "avx512"

1 la respuesta

Difusiones integradas con intrínsecos y ensamblados

En la sección 2.5.3 "Transmisiones" deReferencia de programación de extensiones de conjunto de instrucciones de arquitectura Intel [https://software.intel.com/sites/default/files/managed/07/b7/319433-023.pdf]el aprendemos que AVX512 (y Knights ...

1 la respuesta

¿Cuál es la penalidad de mezclar el esquema codificado EVEX y VEX?

Es unproblema conocido [https://stackoverflow.com/questions/41303780/why-is-this-sse-code-6-times-slower-without-vzeroupper-on-skylake] que mezclar instrucciones codificadas con VEX e instrucciones que no sean VEX tiene una penalización y el ...

2 la respuesta

Agregar horizontal con __m512 (AVX512)

¿Cómo se realiza eficientemente la adición horizontal con flotantes en un registro AVX de 512 bits (es decir, se suman los elementos de un solo vector)? Para registros de 128 y 256 bits, esto se puede hacer usando _mm_hadd_ps y _mm256_hadd_ps ...

0 la respuesta

¿Atomicidad por elemento de carga / almacenamiento de vector y recolección / dispersión?

Considere una matriz comoatomic<int32_t> shared_array[]. ¿Qué pasa si quieres SIMD vectorizar?for(...) sum += shared_array[i].load(memory_order_relaxed)?. ¿O buscar una matriz para el primer elemento que no sea cero, o poner a cero un rango de ...

1 la respuesta

Implementación alternativa para la detección de conflictos en AVX2

AVX512CD contiene el intrínseco_mm512_conflict_epi32(__m512i a) devuelve un vector donde para cada elemento ena se establece un bit si tiene el mismo valor. ¿Hay alguna manera de hacer algo similar en AVX2? No estoy interesado en los bits ...

2 la respuesta

registro inválido para .seh_savexmm en Cygwin

$ make he trabajado con cygwin pero recibí un error de compilación. No estoy seguro de qué es inválido registrarse para .seh_savexmm por favor ayúdenme. Busqué este problema en google pero no encuentro que haya muchos problemas, pero no soultion. ...

1 la respuesta

¿Falta los intrínsecos AVX-512 para las máscaras?

Guía intrínseca de Intelenumera una serie de intrínsecos [https://software.intel.com/sites/landingpage/IntrinsicsGuide/#!=u ndefined&text=_mm512_k&expand=3537,3537,89,750,3039&techs=AVX_512]para las instrucciones de la máscara AVX-512 K *, pero ...

1 la respuesta

¿Cómo funcionan los modos de redondeo AVX512 (o simplemente se confunde NDISASM)?

Estoy tratando de entender la instrucción AVX512F específicavcvtps2udq. La firma de la instrucción esVCVTPS2UDQ zmm1 {k1}{z}, zmm2/m512/m32bcst{er}. La información del manual está abajo. En un intento por comprender los nuevos modos de ...

2 la respuesta

En GNU C inline asm, ¿cuáles son los modificadores para xmm / ymm / zmm para un solo operando?

Mientras trato de responderDifusiones integradas con intrínsecos y ensamblados [https://stackoverflow.com/questions/34415238/embedded-broadcasts-with-intrinsics-and-assembly] , Estaba tratando de hacer algo como esto: __m512 mul_broad(__m512 a, ...

1 la respuesta

¿Cómo hacen las instrucciones de Detección de conflictos que facilitan la vectorización de los bucles?

Las familias de instrucciones AVX512CD son: VPCONFLICT, VPLZCNT y VPBROADCASTM. La sección de Wikipedia sobre estas instrucciones [https://en.wikipedia.org/wiki/AVX-512#New_instructions_in_AVX-512_conflict_detection] dice: Las instrucciones en ...