Unterschied zwischen den AVX-Anweisungen vxorpd und vpxor
Laut demIntel Intrinsics Guide,
vxorpd ymm, ymm, ymm
: Berechnet das bitweise XOR gepackter Gleitkommaelemente mit doppelter Genauigkeit (64-Bit) in a und b und speichert die Ergebnisse in dst.vpxor ymm, ymm, ymm
: Berechne das bitweise XOR von 256 Bits (die ganzzahlige Daten darstellen) in a und b und speichere das Ergebnis in dst.Was ist der Unterschied zwischen den beiden? Es scheint mir, dass beide Befehle ein bitweises XOR für alle 256 Bits der ymm-Register ausführen würden. Gibt es Performance-Einbußen, wenn ich @ benutzvxorpd
fo, r Integer-Daten (und umgekehrt)?