Unterschied zwischen den AVX-Anweisungen vxorpd und vpxor

Laut demIntel Intrinsics Guide,

vxorpd ymm, ymm, ymm: Berechnet das bitweise XOR gepackter Gleitkommaelemente mit doppelter Genauigkeit (64-Bit) in a und b und speichert die Ergebnisse in dst.vpxor ymm, ymm, ymm: Berechne das bitweise XOR von 256 Bits (die ganzzahlige Daten darstellen) in a und b und speichere das Ergebnis in dst.

Was ist der Unterschied zwischen den beiden? Es scheint mir, dass beide Befehle ein bitweises XOR für alle 256 Bits der ymm-Register ausführen würden. Gibt es Performance-Einbußen, wenn ich @ benutzvxorpd fo, r Integer-Daten (und umgekehrt)?

Antworten auf die Frage(2)

Ihre Antwort auf die Frage