Результаты поиска по запросу "simd"
Как рассчитать произведение векторной точки с помощью встроенных функций SSE в C
Я пытаюсь умножить два вектора вместе, где каждый элемент одного вектора умножается на элемент в том же индексе в другом векторе. Затем я хочу суммировать вс...
Как скомпилировать Tensorflow с инструкциями SSE4.2 и AVX?
Это сообщение получено от запуска скрипта, чтобы проверить, работает ли Tensorflow:
Могу ли я использовать AVX FMA для точного 52-битного умножения?
AXV2 не имеет целочисленных умножений с источниками больше 32-битных. Это действительно предлагает32 х 32 -> 32 умножается, а также32 х 32 -> 64 умножа...
@Ermlg Хорошая мысль. Есть ли способ узнать наверняка, что реализация связана с памятью? Или какие-либо другие виды границ, например, границы ошибочного прогнозирования или границы ввода / вывода?
те предположим, что у нас есть функция, которая умножает два массива на 1000000 удваивается каждый. В C / C ++ функция выглядит так:
godbolt.org/g/rt67UM
олее простое представление моей проблемы, я хочу преобразовать значение с плавающей запятой в определенный тип v4si (я хочу использовать SIMD Operation для о...
SSE умножение 2 64-битных целых
Как умножить два 64-разрядных числа на еще 2 64-разрядных числа? Я не нашел ни одной инструкции, которая могла бы это сделать.