Результаты поиска по запросу "sse"

4 ответа

Как правильно использовать различные версии встроенных функций SSE в GCC?

Я задам свой вопрос, приведя пример. Теперь у меня есть функция под названиемdo_something(). Он имеет три версии:do_something(), do_something_sse3(), а такжеdo_something_sse4(), Когда моя программа запускается, она обнаружит функцию ЦП ...

4 ответа

Самый быстрый способ сделать горизонтальную векторную сумму с плавающей точкой на x86

У тебя есть вектор из трех (или четырех) поплавков. Какой самый быстрый способ их сложить? SSE (movaps, shuffle, add, movd) всегда быстрее, чем x87? Стоят ли инструкции горизонтального добавления в SSE4.2? Сколько стоит перейти на FPU, затем ...

1 ответ

SSE: загрузка и сохранение без выравнивания, пересекающие границу страницы

Я где-то читал, что перед выполнением выровненной загрузки или сохраняю рядом с границей страницы (например, используя_mm_loadu_si128 / _mm_storeu_si128 intrinsics), код должен сначала проверить, принадлежит ли весь вектор (в данном случае 16 ...

ТОП публикаций

1 ответ

llatency vs пропускная способность в Intel Intrinsics

Мне кажется, я в целом хорошо понимаю разницу между задержкой и пропускной способностью. Однако влияние задержки на пропускную способность инструкций мне неясно для Intel Intrinsics, особенно при использовании нескольких внутренних вызовов ...

3 ответа

Доступны ли более старые SIMD-версии при использовании более новых?

Когда я могу использовать SSE3 или AVX, тогда доступны более старые версии SSE как SSE2 или MMX - или мне все еще нужно проверять их отдельно?

1 ответ

как я могу использовать инструкции SVML [дубликаты]

На этот вопрос уже есть ответ: Ошибка C ++: «_mm_sin_ps» не был объявлен в этой области [/questions/31978592/c-error-mm-sin-ps-was-not-declared-in-this-scope] 3 ответа Где у Клэнга "_mm256_pow_ps"? ...

1 ответ

шибка @inlining при вызове always_inline '__m128i _mm_cvtepu8_epi32 (__ m128i)': несоответствие конкретной цели _mm_cvtepu8_epi32 (__m128i __X) [duplicate]

На этот вопрос уже есть ответ: шибка @inlining при вызове always_inline ‘_mm_mullo_epi32’: несоответствие целевой опции [/questions/43128698/inlining-failed-in-call-to-always-inline-mm-mullo-epi32-target-specific-opti] 1 ответ Я пытаюсь ...