Результаты поиска по запросу "sse"

5 ответов

Существуют ли беззнаковые эквиваленты инструкций x87 FILD и SSE CVTSI2SD?

Я хочу реализовать эквивалент Cuint-До-double приведен в компиляторе GHC Haskell. Мы уже реализуемint-До-double с помощьюFILD или жеCVTSI2SD, Есть ли неподписанные версии этих операций или я должен обнулить старший битuint перед преобразованием ...

4 ответа

горизонтальная сумма 8 упакованных 32-битных чисел

Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (__m256), какой самый быстрый способ извлечь горизонтальную сумму всех 8 элементов? Точно так же, как получить горизонтальный максимум и минимум? Другими словами, какова лучшая ...

3 ответа

Начало работы с SSE

Я хочу узнать больше об использованииSSE [http://en.wikipedia.org/wiki/Streaming_SIMD_Extensions]. Какие есть способы узнать, кроме очевидного чтенияРуководства разработчика программного обеспечения для архитектур Intel® 64 и ...

ТОП публикаций

1 ответ

SSE Билинейная интерполяция

Я использую билинейную интерполяцию в тесном цикле и пытаюсь оптимизировать ее с помощью SSE, но при этом я получаю нулевое ускорение. Вот код, версия без SIMD использует простую векторную структуру, которая может быть определена какstruct Vec3f ...

2 ответа

Ньютон Рафсон с SSE2 - может кто-нибудь объяснить мне эти 3 строки

Я читаю этот документ: http://software.intel.com/en-us/articles/interactive-ray-tracing [http://software.intel.com/en-us/articles/interactive-ray-tracing] и я наткнулся на эти три строки кода: SIMD-версия уже немного быстрее, но мы можем ...

5 ответов

Почему скаляр SSE sqrt (x) медленнее, чем rsqrt (x) * x?

Я профилировал некоторые наши основные математические расчеты на Intel Core Duo, и, глядя на различные подходы к квадратному корню, я заметил кое-что странное: используя скалярные операции SSE, быстрее получить взаимный квадратный корень ...

4 ответа

Быстрый подсчет количества равных байтов между двумя массивами

Я написал функциюint compare_16bytes(__m128i lhs, __m128i rhs) чтобы сравнить два 16-байтовых числа с использованием инструкций SSE: эта функция возвращает количество байтов, равных после выполнения сравнения. Теперь я хотел бы использовать ...

3 ответа

Как контролировать, использует ли математика C SSE2?

Я вступил в сборку трансцендентных математических функций библиотеки C с MSVC в режиме fp: strict. Кажется, что все они следуют одной и той же схеме, вот что происходит дляsin. Сначала идет процедура отправки из файла с именем ...

1 ответ

SSE регистрация возврата с отключенным SSE

Я нахожусь в следующей ситуации: Я пишу код для ядра, которое не позволяет инструкции SSEМне нужно сделать арифметику с плавающей точкойЯ компилирую для платформы x86_64Вот пример кода, который иллюстрирует проблему: int main(int argc, char** ...

1 ответ

Лучший способ загрузить 64-битное целое число в регистр SSE2 двойной точности?

Каков наилучший / самый быстрый способ загрузки 64-битного целочисленного значения вxmm SSE2 зарегистрироваться в 32-битном режиме? В 64-битном режимеcvtsi2sd можно использовать, но в 32-битном режиме он поддерживает только 32-битные целые ...