Gängige SIMD-Techniken
Wo finde ich Informationen zu gängigen SIMD-Tricks? Ich habe einen Befehlssatz und weiß, wie man einfachen SIMD-Code schreibt, aber ich weiß, SIMD ist jetzt viel leistungsfähiger. Es kann komplexen bedingten Code ohne Verzweigung enthalten.
Beispielsweise (ARMv6
) setzt die folgende Befehlsfolge jedes Byte von Rd gleich dem vorzeichenlosen Minimum der entsprechenden Bytes von Ra und Rb:
USUB8 Rd, Ra, Rb
SEL Rd, Rb, Ra
Links zu Tutorials / ungewöhnlichen SIMD-Techniken sind auch gut :)ARMv6 ist das interessanteste für mich, aberx86(SSE, ...) /Neon(in ARMv7) / andere sind auch gut.