Результаты поиска по запросу "sse"

2 ответа

Как узнать, активирован ли SSE2 в opencv

У меня есть версия библиотеки OpenCV 2.4.10, которая была построена для Intel X64 в Windows.Как я могу узнать, активен ли CV_SSE2? У меня нет кода. У меня пр...

3 ответа

Возможно ли практическое использование BigNum AVX / SSE?

Регистры SSE / AVX можно рассматривать как большие числа с целыми числами или числами с плавающей запятой. То есть можно пренебречь тем, что полосы вообще су...

1 ответ

как я могу использовать инструкции SVML [дубликаты]

На этот вопрос уже есть ответ: Ошибка C ++: «_mm_sin_ps» не был объявлен в этой области [/questions/31978592/c-error-mm-sin-ps-was-not-declared-in-this-scope] 3 ответа Где у Клэнга "_mm256_pow_ps"? ...

ТОП публикаций

2 ответа

Как сложить __m256 по горизонтали?

Я хотел бы суммировать компоненты по горизонтали__m256 вектор с использованием инструкций AVX. В SSE я мог бы использовать _mm_hadd_ps(xmm,xmm); _mm_hadd_ps(xmm,xmm);чтобы получить результат в первом компоненте вектора, но это не масштабируется ...

3 ответа

добавление компонентов регистра SSE

Я хочу добавить четыре компонента регистра SSE, чтобы получить один float. Вот как я это делаю сейчас: float a[4]; _mm_storeu_ps(a, foo128); float x = a[0] + a[1] + a[2] + a[3];Есть ли инструкция SSE, которая непосредственно достигает этого?

1 ответ

Задержки обхода при переключении доменов исполнительного блока

2 ответа

Как использовать инструкции Fused Multiply-Add (FMA) с SSE / AVX

Я узнал, что некоторые процессоры Intel / AMD могут выполнять одновременное умножение и добавление с помощью SSE / AVX: FLOPS за цикл для песчаного моста и скважины SSE2 / AVX / ...

1 ответ

Лучший способ загрузить 64-битное целое число в регистр SSE2 двойной точности?

Каков наилучший / самый быстрый способ загрузки 64-битного целочисленного значения в

2 ответа

SSE: преобразовать короткое целое в число с плавающей точкой

Я хочу преобразовать массив беззнаковых коротких чисел для плавания с использованием SSE. Скажем __m128i xVal; // Has 8 16-bit unsigned integers __m128 y1, y2; // 2 xmm registers for 8 float valuesЯ хочу первые 4 uint16 в y1 и следующие 4 uint16 ...

1 ответ

Влияет ли модификатор Java strictfp на современные процессоры?

Я знаю значение