É _mm_broadcast_ss mais rápido que _mm_set1_ps?

É este código

float a = ...;
__m256 b = _mm_broadcast_ss(&a)

sempre mais rápido que esse código

float a = ...;
_mm_set1_ps(a)

?

E sea definido comostatic const float a = ... ao invés defloat a = ...?