Результаты поиска по запросу "sse"
Временные нагрузки и аппаратный предварительный выбор, они работают вместе?
При выполнении серии
@ Миша: я предполагаю, что люди, которые будут беспокоиться, знают, что они делают, но да =)
ался векторизовать цикл, который содержит использование функции 'pow' в математической библиотеке. Я знаю, что компилятор Intel поддерживает использование 'pow' для инструкций sse - но я не могу заставить его работать с gcc (я думаю). Это тот ...
Возможно ли практическое использование BigNum AVX / SSE?
Регистры SSE / AVX можно рассматривать как большие числа с целыми числами или числами с плавающей запятой. То есть можно пренебречь тем, что полосы вообще су...
Реверсировать регистр AVX, содержащий двойные числа, используя единственный внутренний AVX
Если у меня есть регистр AVX с 4 двойными в них, и я хочу сохранить обратное в другом регистре, возможно ли это сделать с помощью одной встроенной команды? Например: если бы у меня было 4 числа с плавающей точкой в регистре SSE, я мог бы ...
Как выполнить преобразование uint32 / float с SSE?
В SSE есть функция
Преимущества x87 перед SSE
Я знаю, что x87 имеет более высокую внутреннюю точность, что, вероятно, является самой большой разницей, которую люди видят между ней и операциями SSE. Но я должен задаться вопросом, есть ли какая-то другая польза от использования x87? У меня ...
Более быстрое умножение кватернионных векторов не работает
Мне нужна более быстрая процедура умножения кватернионных векторов для моей математической библиотеки. Щас использую канонический
Ньютон Рафсон с SSE2 - может кто-нибудь объяснить мне эти 3 строки
Я читаю этот документ:http://software.intel.com/en-us/articles/interactive-ray-tracingи я наткнулся на эти три строки кода:SIMD-версия уже немного быстрее, н...
Умножение SSE на 4 32-битных целых числа
Как умножить четыре 32-разрядных целых числа на 4 других целых числа? Я не нашел ни одной инструкции, которая могла бы это сделать.