Результаты поиска по запросу "sse"

2 ответа

Различные версии mmx, sse и avx дополняют друг друга или являются надмножествами друг друга?

Я думаю, что я должен ознакомиться с расширениями x86 SIMD. Но прежде чем я даже начал, я столкнулся с проблемой. Я не могу найти хороший обзор, какие из них...

2 ответа

Очистить верхние байты __m128i

5 ответов

GCC - Как перестроить стек?

Я пытаюсь создать приложение, которое использует pthreads и тип __m128 SSE. Согласно руководству GCC, выравнивание стека по умолчанию составляет 16 байтов. Д...

ТОП публикаций

3 ответа

Как я могу проверить, скомпилирован ли мой установленный numpy с набором инструкций SSE / SSE2?

Как я могу проверить, скомпилирована ли моя установленная версия numpy с набором инструкций SSE / SSE2? Я знаю, что некоторые части Numpy использует BLAS, как проверить BLAS тоже?

1 ответ

В чем разница между __popcnt () и _mm_popcnt_u32 ()?

1 ответ

Влияет ли модификатор Java strictfp на современные процессоры?

Я знаю значение

2 ответа

Как использовать инструкции Fused Multiply-Add (FMA) с SSE / AVX

Я узнал, что некоторые процессоры Intel / AMD могут выполнять одновременное умножение и добавление с помощью SSE / AVX:FLOPS за цикл для песчаного моста и ск...

5 ответов

 намного быстрее, если он не попадает в кеш. Но это не будет, если это работает часто

же естьвопрос [https://stackoverflow.com/questions/4609677/implementation-of-aes-in-assembly] на этом, но это было закрыто как "неоднозначное", таким образом, я открываю новый - я нашел ответ, возможно это поможет другим также. Вопрос в том, как ...

1 ответ

Можно ли использовать SSE и SSE2, чтобы сделать целое число шириной 128 бит?

Я хочу немного больше понять возможности SSE2 и хотел бы знать, можно ли создать целое число шириной 128 бит, которое поддерживает сложение, вычитание, XOR и...

1 ответ

Загрузка 8 символов из памяти в переменную __m256 как упакованные числа с плавающей запятой одинарной точности

Я оптимизирую алгоритм размытия по Гауссу на изображении и хочу заменить использование плавающего буфера [8] в приведенном ниже коде встроенной переменной __...