¿Por qué es lento el operador de módulo?

Parafraseando en el libro "Programming Pearls" (sobre el lenguaje c en máquinas antiguas, ya que el libro es de finales de los 90):

Operaciones aritméticas de enteros (+, -, *) puede tomar alrededor de 10 nano segundos mientras que el% El operador tarda hasta 100 nano segundos.

¿Por qué hay tanta diferencia?¿Cómo funciona internamente un operador de módulo?¿Es lo mismo que la división (/) ¿en términos de tiempo?

Respuestas a la pregunta(1)

Su respuesta a la pregunta