Gängige SIMD-Techniken

Wo finde ich Informationen zu gängigen SIMD-Tricks? Ich habe einen Befehlssatz und weiß, wie man einfachen SIMD-Code schreibt, aber ich weiß, SIMD ist jetzt viel leistungsfähiger. Es kann komplexen bedingten Code ohne Verzweigung enthalten.
Beispielsweise (ARMv6) setzt die folgende Befehlsfolge jedes Byte von Rd gleich dem vorzeichenlosen Minimum der entsprechenden Bytes von Ra und Rb:

USUB8 Rd, Ra, Rb
SEL Rd, Rb, Ra

Links zu Tutorials / ungewöhnlichen SIMD-Techniken sind auch gut :)ARMv6 ist das interessanteste für mich, aberx86(SSE, ...) /Neon(in ARMv7) / andere sind auch gut.

Antworten auf die Frage(2)

Ihre Antwort auf die Frage