Результаты поиска по запросу "avx"

3 ответа

_Mm_broadcast_ss быстрее, чем _mm_set1_ps?

Это код float a = ...; __m256 b = _mm_broadcast_ss(&a)всегда быстрее, чем этот код float a = ...; _mm_set1_ps(a)? Что, еслиa определяется какstatic const float a = ... скорее, чемfloat a = ...?

2 ответа

Реверсировать регистр AVX, содержащий двойные числа, используя единственный внутренний AVX

Если у меня есть регистр AVX с 4 двойными в них, и я хочу сохранить обратное в другом регистре, возможно ли это сделать с помощью одной встроенной команды? Например: если бы у меня было 4 числа с плавающей точкой в регистре SSE, я мог бы ...

4 ответа

Примеры и учебные пособия по Intel SSE и AVX [закрыто]

Есть ли хорошие учебники или примеры по C / C ++ для изучения инструкций Intel SSE и AVX? Я нашел несколько на сайтах Microsoft MSDN и Intel, но было бы здорово понять это с основ.

ТОП публикаций

4 ответа

горизонтальная сумма 8 упакованных 32-битных чисел

Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (__m256), какой самый быстрый способ извлечь горизонтальную сумму всех 8 элементов? Точно так же, как получить горизонтальный максимум и минимум? Другими словами, какова лучшая ...

2 ответа

Скаттер присущие в AVX

Я не могу найти их в Intel Intrinsic Guide v2.7. Вы знаете, поддерживают ли их наборы инструкций AVX или AVX2?

2 ответа

FLOPS за цикл для песчаного моста и скважины SSE2 / AVX / AVX2

Я запутался в том, сколько флопов за такт на ядро можно сделать с помощью Sandy-Bridge и Haswell. Насколько я понимаю, с SSE должно быть 4 флопа на такт на ядро для SSE и 8 флопс на такт на ядро для AVX / AVX2. Это, кажется, проверено здесь,Как ...

1 ответ

_mm_testc_ps и _mm_testc_pd vs _mm_testc_si128

Как вы знаете, первые два относятся к спецификациям AVX, а вторая - к SSE4.1. Оба набора встроенных функций могут использоваться для проверки на равенство 2 векторов с плавающей точкой. Мой конкретный вариант использования: _mm_cmpeq_ps ...

3 ответа

Доступны ли более старые SIMD-версии при использовании более новых?

Когда я могу использовать SSE3 или AVX, тогда доступны более старые версии SSE как SSE2 или MMX - или мне все еще нужно проверять их отдельно?

1 ответ

Есть ли обратная инструкция к инструкции Movemask в Intel AVX2?

Инструкция (и) movemask берут __m256i и возвращают int32, где каждый бит (либо первые 4, 8 или все 32 бита в зависимости от типа входного векторного элемента) является старшим значащим битом соответствующего векторного элемента. Я хотел бы ...

2 ответа

Самый быстрый способ умножения массива int64_t?

Я хочу векторизовать умножение двух выровненных массивов памяти. Я не нашел способа умножить 64 * 64 бит в AVX / AVX2, поэтому я просто развернул петлю и загрузил / сохранил AVX2. Есть ли более быстрый способ сделать это? Заметка Я не хочу ...