¿Cómo mover el doble en% rax a la posición particular de qword en% ymm o% zmm? (Kaby Lake o posterior)
La idea es que me gustaría recopilar los valores devueltos dedouble
en un registro vectorial para procesar para la máquinaimm width
a la vezsi almacenar de nuevo en la memoria primero.
l procesamiento particular es unvfma
con otros dos operandos que son todosconstexpr
, para que simplemente puedan ser convocados por_mm256_setr_pd
o carga de memoria alineada / no alineada desdeconstexpr
array
.
Hay una manera de almacenar el doble en%ymm
en una posición particular directamente del valor en%rax
para fines de recolección?
La máquina objetivo es Kaby Lake. También son bienvenidas las instrucciones de vectores más eficientes del futuro.