Результаты поиска по запросу "sse"
Как узнать, активирован ли SSE2 в opencv
У меня есть версия библиотеки OpenCV 2.4.10, которая была построена для Intel X64 в Windows.Как я могу узнать, активен ли CV_SSE2? У меня нет кода. У меня пр...
Возможно ли практическое использование BigNum AVX / SSE?
Регистры SSE / AVX можно рассматривать как большие числа с целыми числами или числами с плавающей запятой. То есть можно пренебречь тем, что полосы вообще су...
как я могу использовать инструкции SVML [дубликаты]
На этот вопрос уже есть ответ: Ошибка C ++: «_mm_sin_ps» не был объявлен в этой области [/questions/31978592/c-error-mm-sin-ps-was-not-declared-in-this-scope] 3 ответа Где у Клэнга "_mm256_pow_ps"? ...
Как сложить __m256 по горизонтали?
Я хотел бы суммировать компоненты по горизонтали__m256 вектор с использованием инструкций AVX. В SSE я мог бы использовать _mm_hadd_ps(xmm,xmm); _mm_hadd_ps(xmm,xmm);чтобы получить результат в первом компоненте вектора, но это не масштабируется ...
добавление компонентов регистра SSE
Я хочу добавить четыре компонента регистра SSE, чтобы получить один float. Вот как я это делаю сейчас: float a[4]; _mm_storeu_ps(a, foo128); float x = a[0] + a[1] + a[2] + a[3];Есть ли инструкция SSE, которая непосредственно достигает этого?
Как использовать инструкции Fused Multiply-Add (FMA) с SSE / AVX
Я узнал, что некоторые процессоры Intel / AMD могут выполнять одновременное умножение и добавление с помощью SSE / AVX: FLOPS за цикл для песчаного моста и скважины SSE2 / AVX / ...
Лучший способ загрузить 64-битное целое число в регистр SSE2 двойной точности?
Каков наилучший / самый быстрый способ загрузки 64-битного целочисленного значения в
SSE: преобразовать короткое целое в число с плавающей точкой
Я хочу преобразовать массив беззнаковых коротких чисел для плавания с использованием SSE. Скажем __m128i xVal; // Has 8 16-bit unsigned integers __m128 y1, y2; // 2 xmm registers for 8 float valuesЯ хочу первые 4 uint16 в y1 и следующие 4 uint16 ...