Nov 04, 2012, 01:55 PM

intrinsics avx sse vectorization

Как сложить __m256 по горизонтали?

Я хотел бы суммировать компоненты по горизонтали__m256 вектор с использованием инструкций AVX. В SSE я мог бы использовать

_mm_hadd_ps(xmm,xmm);
_mm_hadd_ps(xmm,xmm);

чтобы получить результат в первом компоненте вектора, но это не масштабируется с 256-битной версией функции (_mm256_hadd_ps).

Каков наилучший способ вычислить горизонтальную сумму__m256 вектор?

Ответы на вопрос(2)

Популярные вопросы

0 ответов

Как я могу сказать AngularJS «обновить»

0 ответов

DCT, используя только целое число

0 ответов

Установите значение для редактора без выбора всего редактора

0 ответов

Как настроить tomcat для привязки к одному IP-адресу (localhost) вместо всех адресов?

0 ответов

Развертка с использованием несвязанных комбинированных списков с Access «Непрерывная форма»