Стандартный код C ++ 11 эквивалентен инструкции PEXT Haswell (и, вероятно, будет оптимизирован компилятором)
Архитектура Haswell предлагает несколько новых инструкций. Один из них является (PEXT
извлечение параллельных битов) чья функциональность объясняется этим изображением (источникВот):
Это принимает значениеr2
и маскаr3
и кладет извлеченные битыr2
вr1
Мой вопрос заключается в следующем: что будет эквивалентным кодом оптимизированной шаблонной функции вчистый стандарт C ++ 11, который, вероятно, будет оптимизирован для этой инструкции компиляторами в будущем.