Результаты поиска по запросу "simd"

3 ответа

упаковка 10-битных значений в поток байтов с SIMD

Я пытаюсь упаковать 10-битные пиксели в непрерывный поток байтов, используя инструкции SIMD. Код ниже делает это «в принципе», но версия SIMD медленнее, чем ...

1 ответ

Как эта функция вычисляет абсолютное значение с плавающей запятой через операции NOT и AND?

Я пытаюсь понять, как работает следующий фрагмент кода. Эта программа использует векторные инструкции SIMD (Intel SSE) для вычисления абсолютного значения 4-...

1 ответ

Самый быстрый способ распаковать 32 бита в 32-байтовый вектор SIMD

32 бита хранятся в

ТОП публикаций

3 ответа

транспонировать для 8 регистров 16-битных элементов на SSE2 / SSSE3

(Я новичок в SSE / asm, извиняюсь, если это очевидно или излишне)Есть ли лучший способ транспонировать 8 регистров SSE, содержащих 16-битные значения, чем вы...

3 ответа

Проверка равенства между двумя переменными __m128i

Если я хочу сделать битовый тест на равенство между двумя

2 ответа

Горизонтальное добавление с __m512 (AVX512)

Как эффективно выполнить горизонтальное сложение с плавающими в 512-битном регистре AVX (т.е. сложить элементы из одного вектора вместе)? Для 128- и 256-битн...

1 ответ

Разница между инструкциями AVX vxorpd и vpxor

2 ответа

Процессор SIMD против GPU SIMD?

2 ответа

Очистить верхние байты __m128i

Как мне очистить16 - i старшие байты__m128i? Я попробовал это; это работает, но мне интересно, есть ли лучший (короче, быстрее) способ: int i = ... // 0 < i < 16 __m128i x = ... __m128i mask = _mm_set_epi8( 0, (i > 14) ? -1 : 0, (i > 13) ? -1 : ...

2 ответа

Самый быстрый 64-битный подсчет населения (вес Хэмминга)

Мне пришлось рассчитать вес Хэмминга для довольно быстрого непрерывного потока 64-битных данных и использовать