Técnicas SIMD comuns

Onde posso encontrar informações sobre truques comuns do SIMD? Eu tenho um conjunto de instruções e sei como escrever código SIMD não complicado, mas sei que agora o SIMD é muito mais poderoso. Ele pode conter código sem ramificação condicional complexo.
Por exemplo (ARMv6), a seguinte sequência de instruções define cada byte de Rd igual ao mínimo não assinado dos bytes correspondentes de Ra e Rb:

USUB8 Rd, Ra, Rb
SEL Rd, Rb, Ra

Links para tutoriais / técnicas SIMD incomuns também são boas :)ARMv6 é o mais interessante para mim, masx86(SSE, ...) /Néon(no ARMv7) / outros também são bons.

questionAnswers(2)

yourAnswerToTheQuestion