Resultados de la búsqueda a petición "fma"

2 la respuesta

Anomalía significativa en el rendimiento de FMA experimentada en el procesador Intel Broadwell

Código1: vzeroall mov rcx, 1000000 startLabel1: vfmadd231ps ymm0, ymm0, ymm0 vfmadd231ps ymm1, ymm1, ymm1 vfmadd231ps ymm2, ymm2, ymm2 vfmadd231ps ymm3, ymm3, ymm3 vfmadd231ps ymm4, ymm4, ymm4 vfmadd231ps ymm5, ymm5, ymm5 vfmadd231ps ymm6, ymm6, ...

2 la respuesta

Fusión múltiple agregada y modos de redondeo predeterminados

Con GCC 5.3, el siguiente código compield con-O3 -fma float mul_add(float a, float b, float c) { return a*b + c; }produce el siguiente ensamblaje vfmadd132ss %xmm1, %xmm2, %xmm0 retNoté que GCC hacía esto con-O3 ya en GCC ...