¿Qué tan rápido es un bloqueo no impugnado?

Y cuánto más rápido / lento es en comparación con una operación de variable atómica no disputada (como atómica <> de C ++). Además, ¿cuánto más lentas son las variables atómicas disputadas en relación con el bloqueo no disputado? La arquitectura en la que estoy trabajando es x86-64.