Результаты поиска по запросу "simd"

4 ответа

горизонтальная сумма 8 упакованных 32-битных чисел

Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (__m256), какой самый быстрый способ извлечь горизонтальную сумму всех 8 элементов? Точно так же, как получить горизонтальный максимум и минимум? Другими словами, какова лучшая ...

3 ответа

Начало работы с SSE

Я хочу узнать больше об использованииSSE [http://en.wikipedia.org/wiki/Streaming_SIMD_Extensions]. Какие есть способы узнать, кроме очевидного чтенияРуководства разработчика программного обеспечения для архитектур Intel® 64 и ...

3 ответа

Параллельно для vs omp simd: когда использовать каждый?

OpenMP 4.0 [http://www.openmp.org/mp-documents/OpenMP4.0RC1_final.pdf]вводит новую конструкцию под названием "omp simd". В чем преимущество использования этой конструкции по сравнению со старой «параллелью для»? Когда каждый из них будет лучшим ...

ТОП публикаций

4 ответа

Быстрый подсчет количества равных байтов между двумя массивами

Я написал функциюint compare_16bytes(__m128i lhs, __m128i rhs) чтобы сравнить два 16-байтовых числа с использованием инструкций SSE: эта функция возвращает количество байтов, равных после выполнения сравнения. Теперь я хотел бы использовать ...

1 ответ

Использование XMVECTOR из DirectXMath в качестве члена класса вызывает сбой только в режиме выпуска?

Я пытался использовать XMVECTOR в качестве члена класса для ограничивающего прямоугольника, так как я делаю много вычислений, но я использую XMFLOAT3 только один раз на кадр, поэтому ограничивающий прямоугольник имеет метод, который дает мне его ...

1 ответ

Как ускорить эту гистограмму поисков LUT?

Во-первых, у меня есть массивint a[1000][1000]. Все эти целые числа находятся в диапазоне от 0 до 32767, и они являются известными константами: они никогда не меняются во время выполнения программы. Во-вторых, у меня есть массив b [32768], ...

3 ответа

Доступны ли более старые SIMD-версии при использовании более новых?

Когда я могу использовать SSE3 или AVX, тогда доступны более старые версии SSE как SSE2 или MMX - или мне все еще нужно проверять их отдельно?

1 ответ

Почему некоторые задержки Haswell AVX объявлены Intel в 3 раза медленнее, чем Sandy Bridge?

В Intelintrinsics ...

1 ответ

_mm_testc_ps и _mm_testc_pd vs _mm_testc_si128

Как вы знаете, первые два относятся к спецификациям AVX, а вторая - к SSE4.1. Оба набора встроенных функций могут использоваться для проверки на равенство 2 векторов с плавающей точкой. Мой конкретный вариант использования: _mm_cmpeq_ps ...

3 ответа

Как вы загружаете / сохраняете из / в массив двойников с помощью GNU C Vector Extensions?

Я использую GNU C векторные расширения [https://gcc.gnu.org/onlinedocs/gcc/Vector-Extensions.html], а не Intel_mm_* intrinsics. Я хочу сделать то же самое, что и Int_m256_loadu_pd встроенный. Присваивание значений одно за другим происходит ...