Técnicas SIMD comuns
Onde posso encontrar informações sobre truques comuns do SIMD? Eu tenho um conjunto de instruções e sei como escrever código SIMD não complicado, mas sei que agora o SIMD é muito mais poderoso. Ele pode conter código sem ramificação condicional complexo.
Por exemplo (ARMv6
), a seguinte sequência de instruções define cada byte de Rd igual ao mínimo não assinado dos bytes correspondentes de Ra e Rb:
USUB8 Rd, Ra, Rb
SEL Rd, Rb, Ra
Links para tutoriais / técnicas SIMD incomuns também são boas :)ARMv6 é o mais interessante para mim, masx86(SSE, ...) /Néon(no ARMv7) / outros também são bons.