x86 max / min asm instruções?

Há alguma instrução asm que pode acelerar o cálculo de min / max do vetor de duplas / inteiros na arquitetura Core i7?

Atualizar:

Eu não esperava respostas tão ricas, obrigada. Então eu vejo que max / min é possível fazer sem ramificação. Eu tenho subquestão:

Existe uma maneira eficiente de obter o índice do maior duplo em array?

questionAnswers(6)

yourAnswerToTheQuestion