Результаты поиска по запросу "simd"
Как инструкции по обнаружению конфликтов облегчают векторизацию циклов?
Семейства команд AVX512CD: VPCONFLICT, VPLZCNT и VPBROADCASTM.Раздел Википедии об этих инструкциях говорит:Инструкции в AVX-512 обнаружении конфликтов (AVX-5...
Умножение SSE 16 x uint8_t
Я хочу умножить с SSE4__m128i объект с 16 беззнаковыми 8-битными целыми числами, но я мог найти только встроенную функцию для умножения 16-битных целых чисел. Нет ничего такого как_mm_mult_epi8?
горизонтальная сумма 8 упакованных 32-битных чисел
Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (__m256), какой самый быстрый способ извлечь горизонтальную сумму всех 8 элементов? Точно так же, как получить горизонтальный максимум и минимум? Другими словами, какова лучшая ...
Инструкция SSE, чтобы проверить, является ли байтовый массив нулем C #
Предположим, у меня есть
микро-слияния. Глупые, глючные инструменты с закрытым исходным кодом.) Во всяком случае, это поднимает планку еще больше, чтобы любой другой подход конкурировать.
у ускорить следующую операцию с инструкциями AVX2, но я не смог найти способ сделать это. Мне дали большой массивuint64_t data[100000] из uint64_t и массивunsigned char indices[100000] байтов. Я хочу вывести массивuint64_t Out[256] где i-е ...
@ watson1180 аппроксимация рациональной функции, очевидно, медленнее, чем методы ряда Тейлора на современном оборудовании
ужна реализация с открытым исходным кодом (без ограничений по лицензии), функция журнала, что-то с подписью
Методы векторизации гистограммы в SIMD?
Я пытаюсь реализовать гистограмму в Неоне. Можно ли векторизовать?
Как мне преобразовать _m128i в неподписанное int с SSE?
Я сделал функцию для постеризации изображений. // =( #define ARGB_COLOR(a, r, g, b) (((a) << 24) | ((r) << 16) | ((g) << 8) | (b)) inline UINT PosterizeColor(const UINT &color, const float &nColors) { __m128 clr = _mm_cvtepi32_ps( ...