это 2 мопс. (И вызывает остановку перехода SSE / AVX на Haswell, но не Skylake). Кроме того, все эти операции являются частью цепочки зависимостей для изменяемого регистра, в отличие от установки значения в другом регистре и смешивания.

состоит в том, что я хотел бы собрать возвращенные значенияdouble в векторный регистр для обработки для машиныimm width вовремябез Сохранение обратно в память первым.

Конкретная обработка являетсяvfma с двумя другими операндами, которые всеconstexpr, так что они могут быть просто вызваны_mm256_setr_pd или выравнивание / выравнивание загрузки памяти изconstexpr array.

Есть ли способ хранить двойной в%ymm в конкретной позиции непосредственно из значения в%rax для сбора цели?

Целевой машиной является Kaby Lake. Также приветствуются более эффективные будущие векторные инструкции.

Ответы на вопрос(1)

Ваш ответ на вопрос