Разница между инструкциями AVX vxorpd и vpxor
СогласноIntel Intrinsics Guide,
vxorpd ymm, ymm, ymm
: Вычислить поразрядное значение XOR для упакованных элементов с плавающей запятой двойной точности (64-разрядных) в a и b и сохранить результаты в dst.vpxor ymm, ymm, ymm
: Вычислить побитовое значение XOR 256 битов (представляющих целочисленные данные) в a и b и сохранить результат в dst.Какая разница между двумя? Мне кажется, что обе инструкции делали бы битовое XOR для всех 256 битов регистров ymm. Есть ли какие-либо потери производительности, если я используюvxorpd
для целочисленных данных (и наоборот)?