это 2 мопс. (И вызывает остановку перехода SSE / AVX на Haswell, но не Skylake). Кроме того, все эти операции являются частью цепочки зависимостей для изменяемого регистра, в отличие от установки значения в другом регистре и смешивания.
состоит в том, что я хотел бы собрать возвращенные значенияdouble
в векторный регистр для обработки для машиныimm width
вовремябез Сохранение обратно в память первым.
Конкретная обработка являетсяvfma
с двумя другими операндами, которые всеconstexpr
, так что они могут быть просто вызваны_mm256_setr_pd
или выравнивание / выравнивание загрузки памяти изconstexpr
array
.
Есть ли способ хранить двойной в%ymm
в конкретной позиции непосредственно из значения в%rax
для сбора цели?
Целевой машиной является Kaby Lake. Также приветствуются более эффективные будущие векторные инструкции.