Результаты поиска по запросу "simd"

Семейства команд AVX512CD: VPCONFLICT, VPLZCNT и VPBROADCASTM.Раздел Википедии об этих инструкциях говорит:Инструкции в AVX-512 обнаружении конфликтов (AVX-5...

sse x86 sse4

3 ответа

Умножение SSE 16 x uint8_t

Я хочу умножить с SSE4__m128i объект с 16 беззнаковыми 8-битными целыми числами, но я мог найти только встроенную функцию для умножения 16-битных целых чисел. Нет ничего такого как_mm_mult_epi8?

c++avx x86 sse

1 ответ

Сдвиг 4 целых числа вправо на разные значения SIMD

ТОП публикаций

Test Test Test Test Test Test

21 Startup Ideas to Start Profitable Business in 2020

How To Build E-Learning Platform From Scratch: The Complex Guide From Idea to MVP

How to Raise Your Own SaaS Product off the Ground and Avoid Common Pitfalls

sse avx x86

4 ответа

горизонтальная сумма 8 упакованных 32-битных чисел

Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (__m256), какой самый быстрый способ извлечь горизонтальную сумму всех 8 элементов? Точно так же, как получить горизонтальный максимум и минимум? Другими словами, какова лучшая ...

arrays mono performance c#

1 ответ

Инструкция SSE, чтобы проверить, является ли байтовый массив нулем C #

Предположим, у меня есть

avx avx2 optimization x86

2 ответа

микро-слияния. Глупые, глючные инструменты с закрытым исходным кодом.) Во всяком случае, это поднимает планку еще больше, чтобы любой другой подход конкурировать.

у ускорить следующую операцию с инструкциями AVX2, но я не смог найти способ сделать это. Мне дали большой массивuint64_t data[100000] из uint64_t и массивunsigned char indices[100000] байтов. Я хочу вывести массивuint64_t Out[256] где i-е ...

c++c optimization sse

5 ответов

@ watson1180 аппроксимация рациональной функции, очевидно, медленнее, чем методы ряда Тейлора на современном оборудовании

ужна реализация с открытым исходным кодом (без ограничений по лицензии), функция журнала, что-то с подписью

histogram neon arm image-processing

3 ответа

Методы векторизации гистограммы в SIMD?

Я пытаюсь реализовать гистограмму в Неоне. Можно ли векторизовать?

c intrinsics sse2 sse

3 ответа

В чем разница между логическими SSE?

image-processing sse c++

2 ответа

Как мне преобразовать _m128i в неподписанное int с SSE?

Я сделал функцию для постеризации изображений. // =( #define ARGB_COLOR(a, r, g, b) (((a) << 24) | ((r) << 16) | ((g) << 8) | (b)) inline UINT PosterizeColor(const UINT &color, const float &nColors) { __m128 clr = _mm_cvtepi32_ps( ...

Страница 1 из 14

12 3 4 5

Результаты поиска по запросу "simd"

Как инструкции по обнаружению конфликтов облегчают векторизацию циклов?

Умножение SSE 16 x uint8_t

Сдвиг 4 целых числа вправо на разные значения SIMD

Популярные теги

ТОП публикаций

горизонтальная сумма 8 упакованных 32-битных чисел

Инструкция SSE, чтобы проверить, является ли байтовый массив нулем C #

микро-слияния. Глупые, глючные инструменты с закрытым исходным кодом.) Во всяком случае, это поднимает планку еще больше, чтобы любой другой подход конкурировать.

@ watson1180 аппроксимация рациональной функции, очевидно, медленнее, чем методы ряда Тейлора на современном оборудовании

Методы векторизации гистограммы в SIMD?

В чем разница между логическими SSE?

Как мне преобразовать _m128i в неподписанное int с SSE?

Вы очень активны! Это здорово!

Результаты поиска по запросу "simd"

Популярные теги

ТОП публикаций