Результаты поиска по запросу "simd"

1 ответ

Как инструкции по обнаружению конфликтов облегчают векторизацию циклов?

Семейства команд AVX512CD: VPCONFLICT, VPLZCNT и VPBROADCASTM.Раздел Википедии об этих инструкциях говорит:Инструкции в AVX-512 обнаружении конфликтов (AVX-5...

1 ответ

Как ускорить эту гистограмму поисков LUT?

Во-первых, у меня есть массивint a[1000][1000]. Все эти целые числа находятся в диапазоне от 0 до 32767, и они являются известными константами: они никогда не меняются во время выполнения программы. Во-вторых, у меня есть массив b [32768], ...

3 ответа

Как вы загружаете / сохраняете из / в массив двойников с помощью GNU C Vector Extensions?

Я использую GNU C векторные расширения [https://gcc.gnu.org/onlinedocs/gcc/Vector-Extensions.html], а не Intel_mm_* intrinsics. Я хочу сделать то же самое, что и Int_m256_loadu_pd встроенный. Присваивание значений одно за другим происходит ...

ТОП публикаций

1 ответ

Выравнивание и странное поведение SSE

Я пытаюсь работать с SSE, и я столкнулся с некоторым странным поведением.Я пишу простой код для сравнения двух строк с SSE Intrinsics, запускаю его, и он раб...

1 ответ

Сдвиг 4 целых числа вправо на разные значения SIMD

1 ответ

AVX2, Как эффективно загрузить четыре целых числа в четные индексы 256-битного регистра и копировать в нечетные индексы?

1 ответ

Как я могу применить __attribute __ ((выровненный (32))) к int *?

1 ответ

Почему некоторые задержки Haswell AVX объявлены Intel в 3 раза медленнее, чем Sandy Bridge?

В Intelintrinsics ...

1 ответ

_mm_testc_ps и _mm_testc_pd vs _mm_testc_si128

Как вы знаете, первые два относятся к спецификациям AVX, а вторая - к SSE4.1. Оба набора встроенных функций могут использоваться для проверки на равенство 2 векторов с плавающей точкой. Мой конкретный вариант использования: _mm_cmpeq_ps ...

2 ответа

Индексы ненулевых байтов регистра SSE / AVX