Результаты поиска по запросу "sse"
Как правильно использовать различные версии встроенных функций SSE в GCC?
Я задам свой вопрос, приведя пример. Теперь у меня есть функция под названиемdo_something(). Он имеет три версии:do_something(), do_something_sse3(), а такжеdo_something_sse4(), Когда моя программа запускается, она обнаружит функцию ЦП ...
Самый быстрый способ сделать горизонтальную векторную сумму с плавающей точкой на x86
У тебя есть вектор из трех (или четырех) поплавков. Какой самый быстрый способ их сложить? SSE (movaps, shuffle, add, movd) всегда быстрее, чем x87? Стоят ли инструкции горизонтального добавления в SSE4.2? Сколько стоит перейти на FPU, затем ...
SSE: загрузка и сохранение без выравнивания, пересекающие границу страницы
Я где-то читал, что перед выполнением выровненной загрузки или сохраняю рядом с границей страницы (например, используя_mm_loadu_si128 / _mm_storeu_si128 intrinsics), код должен сначала проверить, принадлежит ли весь вектор (в данном случае 16 ...
llatency vs пропускная способность в Intel Intrinsics
Мне кажется, я в целом хорошо понимаю разницу между задержкой и пропускной способностью. Однако влияние задержки на пропускную способность инструкций мне неясно для Intel Intrinsics, особенно при использовании нескольких внутренних вызовов ...
Доступны ли более старые SIMD-версии при использовании более новых?
Когда я могу использовать SSE3 или AVX, тогда доступны более старые версии SSE как SSE2 или MMX - или мне все еще нужно проверять их отдельно?
как я могу использовать инструкции SVML [дубликаты]
На этот вопрос уже есть ответ: Ошибка C ++: «_mm_sin_ps» не был объявлен в этой области [/questions/31978592/c-error-mm-sin-ps-was-not-declared-in-this-scope] 3 ответа Где у Клэнга "_mm256_pow_ps"? ...
шибка @inlining при вызове always_inline '__m128i _mm_cvtepu8_epi32 (__ m128i)': несоответствие конкретной цели _mm_cvtepu8_epi32 (__m128i __X) [duplicate]
На этот вопрос уже есть ответ: шибка @inlining при вызове always_inline ‘_mm_mullo_epi32’: несоответствие целевой опции [/questions/43128698/inlining-failed-in-call-to-always-inline-mm-mullo-epi32-target-specific-opti] 1 ответ Я пытаюсь ...