O pipeline do ARM Cortex-A8 13 estágios ou 14 estágios?

Se você ver este diagrama de pipeline popular de ARM Cortex-A8 dado em um dos ARMapresentações. É claro que o estágio de busca de instrução leva 3 ciclos, mas o primeiro ciclo étipo de desconto. Mas por que? Alguma ideia?

Obrigado...