Результаты поиска по запросу "simd"

1 ответ

Как инструкции по обнаружению конфликтов облегчают векторизацию циклов?

Семейства команд AVX512CD: VPCONFLICT, VPLZCNT и VPBROADCASTM.Раздел Википедии об этих инструкциях говорит:Инструкции в AVX-512 обнаружении конфликтов (AVX-5...

3 ответа

Умножение SSE 16 x uint8_t

Я хочу умножить с SSE4__m128i объект с 16 беззнаковыми 8-битными целыми числами, но я мог найти только встроенную функцию для умножения 16-битных целых чисел. Нет ничего такого как_mm_mult_epi8?

1 ответ

Сдвиг 4 целых числа вправо на разные значения SIMD

ТОП публикаций

4 ответа

горизонтальная сумма 8 упакованных 32-битных чисел

Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (__m256), какой самый быстрый способ извлечь горизонтальную сумму всех 8 элементов? Точно так же, как получить горизонтальный максимум и минимум? Другими словами, какова лучшая ...

1 ответ

Инструкция SSE, чтобы проверить, является ли байтовый массив нулем C #

Предположим, у меня есть

2 ответа

 микро-слияния. Глупые, глючные инструменты с закрытым исходным кодом.) Во всяком случае, это поднимает планку еще больше, чтобы любой другой подход конкурировать.

у ускорить следующую операцию с инструкциями AVX2, но я не смог найти способ сделать это. Мне дали большой массивuint64_t data[100000] из uint64_t и массивunsigned char indices[100000] байтов. Я хочу вывести массивuint64_t Out[256] где i-е ...

5 ответов

@ watson1180 аппроксимация рациональной функции, очевидно, медленнее, чем методы ряда Тейлора на современном оборудовании

ужна реализация с открытым исходным кодом (без ограничений по лицензии), функция журнала, что-то с подписью

3 ответа

Методы векторизации гистограммы в SIMD?

Я пытаюсь реализовать гистограмму в Неоне. Можно ли векторизовать?

3 ответа

В чем разница между логическими SSE?

2 ответа

Как мне преобразовать _m128i в неподписанное int с SSE?

Я сделал функцию для постеризации изображений. // =( #define ARGB_COLOR(a, r, g, b) (((a) << 24) | ((r) << 16) | ((g) << 8) | (b)) inline UINT PosterizeColor(const UINT &color, const float &nColors) { __m128 clr = _mm_cvtepi32_ps( ...