Результаты поиска по запросу "simd"
упаковка 10-битных значений в поток байтов с SIMD
Я пытаюсь упаковать 10-битные пиксели в непрерывный поток байтов, используя инструкции SIMD. Код ниже делает это «в принципе», но версия SIMD медленнее, чем ...
Как эта функция вычисляет абсолютное значение с плавающей запятой через операции NOT и AND?
Я пытаюсь понять, как работает следующий фрагмент кода. Эта программа использует векторные инструкции SIMD (Intel SSE) для вычисления абсолютного значения 4-...
Самый быстрый способ распаковать 32 бита в 32-байтовый вектор SIMD
32 бита хранятся в
транспонировать для 8 регистров 16-битных элементов на SSE2 / SSSE3
(Я новичок в SSE / asm, извиняюсь, если это очевидно или излишне)Есть ли лучший способ транспонировать 8 регистров SSE, содержащих 16-битные значения, чем вы...
Проверка равенства между двумя переменными __m128i
Если я хочу сделать битовый тест на равенство между двумя
Горизонтальное добавление с __m512 (AVX512)
Как эффективно выполнить горизонтальное сложение с плавающими в 512-битном регистре AVX (т.е. сложить элементы из одного вектора вместе)? Для 128- и 256-битн...
Очистить верхние байты __m128i
Как мне очистить16 - i старшие байты__m128i? Я попробовал это; это работает, но мне интересно, есть ли лучший (короче, быстрее) способ: int i = ... // 0 < i < 16 __m128i x = ... __m128i mask = _mm_set_epi8( 0, (i > 14) ? -1 : 0, (i > 13) ? -1 : ...
Самый быстрый 64-битный подсчет населения (вес Хэмминга)
Мне пришлось рассчитать вес Хэмминга для довольно быстрого непрерывного потока 64-битных данных и использовать