Стандартный код C ++ 11 эквивалентен инструкции PEXT Haswell (и, вероятно, будет оптимизирован компилятором)

Архитектура Haswell предлагает несколько новых инструкций. Один из них является (PEXTизвлечение параллельных битов) чья функциональность объясняется этим изображением (источникВот):

Это принимает значениеr2 и маскаr3 и кладет извлеченные битыr2 вr1

Мой вопрос заключается в следующем: что будет эквивалентным кодом оптимизированной шаблонной функции вчистый стандарт C ++ 11, который, вероятно, будет оптимизирован для этой инструкции компиляторами в будущем.

Ответы на вопрос(1)

Ваш ответ на вопрос