¿Es _mm_broadcast_ss más rápido que _mm_set1_ps?

Es este codigo

float a = ...;
__m256 b = _mm_broadcast_ss(&a)

siempre más rápido que este código

float a = ...;
_mm_set1_ps(a)

?

Y sia definido comostatic const float a = ... más bien quefloat a = ...?