Divisão de ponto flutuante vs multiplicação de ponto flutuante

Existe algum ganho de desempenho (sem micro-otimização) codificando

float f1 = 200f / 2

em comparação com

float f2 = 200f * 0.5

Um professor meu me disse há alguns anos que as divisões de ponto flutuante eram mais lentas que as multiplicações de ponto flutuante sem explicar o porqu

Esta declaração vale para a arquitetura moderna de P

Update1

Em relação a um comentário, considere também este caso:

float f1;
float f2 = 2
float f3 = 3;
for( i =0 ; i < 1e8; i++)
{
  f1 = (i * f2 + i / f3) * 0.5; //or divide by 2.0f, respectively
}

Update 2 Citando os comentários:

[Quero] saber quais são os requisitos algorítmicos / arquiteturais que fazem com que a divisão seja muito mais complicada em hardware do que a multiplicação

questionAnswers(7)

yourAnswerToTheQuestion