Результаты поиска по запросу "sse"
Существуют ли беззнаковые эквиваленты инструкций x87 FILD и SSE CVTSI2SD?
Я хочу реализовать эквивалент Cuint-До-double приведен в компиляторе GHC Haskell. Мы уже реализуемint-До-double с помощьюFILD или жеCVTSI2SD, Есть ли неподписанные версии этих операций или я должен обнулить старший битuint перед преобразованием ...
горизонтальная сумма 8 упакованных 32-битных чисел
Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (__m256), какой самый быстрый способ извлечь горизонтальную сумму всех 8 элементов? Точно так же, как получить горизонтальный максимум и минимум? Другими словами, какова лучшая ...
Начало работы с SSE
Я хочу узнать больше об использованииSSE [http://en.wikipedia.org/wiki/Streaming_SIMD_Extensions]. Какие есть способы узнать, кроме очевидного чтенияРуководства разработчика программного обеспечения для архитектур Intel® 64 и ...
SSE Билинейная интерполяция
Я использую билинейную интерполяцию в тесном цикле и пытаюсь оптимизировать ее с помощью SSE, но при этом я получаю нулевое ускорение. Вот код, версия без SIMD использует простую векторную структуру, которая может быть определена какstruct Vec3f ...
Ньютон Рафсон с SSE2 - может кто-нибудь объяснить мне эти 3 строки
Я читаю этот документ: http://software.intel.com/en-us/articles/interactive-ray-tracing [http://software.intel.com/en-us/articles/interactive-ray-tracing] и я наткнулся на эти три строки кода: SIMD-версия уже немного быстрее, но мы можем ...
Почему скаляр SSE sqrt (x) медленнее, чем rsqrt (x) * x?
Я профилировал некоторые наши основные математические расчеты на Intel Core Duo, и, глядя на различные подходы к квадратному корню, я заметил кое-что странное: используя скалярные операции SSE, быстрее получить взаимный квадратный корень ...
Быстрый подсчет количества равных байтов между двумя массивами
Я написал функциюint compare_16bytes(__m128i lhs, __m128i rhs) чтобы сравнить два 16-байтовых числа с использованием инструкций SSE: эта функция возвращает количество байтов, равных после выполнения сравнения. Теперь я хотел бы использовать ...
Как контролировать, использует ли математика C SSE2?
Я вступил в сборку трансцендентных математических функций библиотеки C с MSVC в режиме fp: strict. Кажется, что все они следуют одной и той же схеме, вот что происходит дляsin. Сначала идет процедура отправки из файла с именем ...
SSE регистрация возврата с отключенным SSE
Я нахожусь в следующей ситуации: Я пишу код для ядра, которое не позволяет инструкции SSEМне нужно сделать арифметику с плавающей точкойЯ компилирую для платформы x86_64Вот пример кода, который иллюстрирует проблему: int main(int argc, char** ...
Лучший способ загрузить 64-битное целое число в регистр SSE2 двойной точности?
Каков наилучший / самый быстрый способ загрузки 64-битного целочисленного значения вxmm SSE2 зарегистрироваться в 32-битном режиме? В 64-битном режимеcvtsi2sd можно использовать, но в 32-битном режиме он поддерживает только 32-битные целые ...