Результаты поиска по запросу "sse"

1 ответ

Где VPERMB в AVX2?

1 ответ

SSE: загрузка и сохранение без выравнивания, пересекающие границу страницы

Я где-то читал, что перед выполнением выровненной загрузки или сохраняю рядом с границей страницы (например, используя_mm_loadu_si128 / _mm_storeu_si128 intrinsics), код должен сначала проверить, принадлежит ли весь вектор (в данном случае 16 ...

1 ответ

NEON, SSE и чередование нагрузок и тасовок

Я пытаюсь понять комментарий, сделанный "Iwillnotexist Idonotexist" вSIMD оптимизация cvtColor с использованием встроенных функций ARM NEON:... поч...

ТОП публикаций

1 ответ

Где Кланг '_mm256_pow_ps' свойственный?

Кажется, я не могу найти встроенные функции для _mm_pow_ps или _mm256_pow_ps, оба из которых должны быть включены в immintrin.h.Clang не определяет их или он...

1 ответ

Самый эффективный способ получить __m256 горизонтальных сумм из 8 исходных __m256 векторов

Я знаю как подвести итог

1 ответ

Инструкция SSE MOVSD (расширенная: скалярные и векторные операции с плавающей точкой на x86, x86-64)

Меня как-то смущает инструкция по сборке MOVSD. Я написал некоторый числовой код, вычисляющий некоторое умножение матриц, просто используя обычный код C без ...

1 ответ

шибка @inlining при вызове always_inline '__m128i _mm_cvtepu8_epi32 (__ m128i)': несоответствие конкретной цели _mm_cvtepu8_epi32 (__m128i __X) [duplicate]

На этот вопрос уже есть ответ: шибка @inlining при вызове always_inline ‘_mm_mullo_epi32’: несоответствие целевой опции [/questions/43128698/inlining-failed-in-call-to-always-inline-mm-mullo-epi32-target-specific-opti] 1 ответ Я пытаюсь ...

2 ответа

Индексы ненулевых байтов регистра SSE / AVX

0 ответов

Как реализовать atoi с помощью SIMD?

Я хотел бы попытаться написать реализацию atoi с использованием инструкций SIMD, которая будет включена вRapidJSON (библиотека для чтения / записи C ++ JSON)...

1 ответ

Каковы лучшие последовательности команд для генерации векторных констант на лету?

«Наилучший» означает наименьшее количество инструкций (или наименьшее количество мопов, если какие-либо инструкции декодируются в более чем один моп). Размер...