Результаты поиска по запросу "simd"

4 ответа

Как рассчитать произведение векторной точки с помощью встроенных функций SSE в C

Я пытаюсь умножить два вектора вместе, где каждый элемент одного вектора умножается на элемент в том же индексе в другом векторе. Затем я хочу суммировать вс...

11 ответов

Как скомпилировать Tensorflow с инструкциями SSE4.2 и AVX?

Это сообщение получено от запуска скрипта, чтобы проверить, работает ли Tensorflow:

0 ответов

Конвенция для отображения векторных регистров

ТОП публикаций

3 ответа

Могу ли я использовать AVX FMA для точного 52-битного умножения?

AXV2 не имеет целочисленных умножений с источниками больше 32-битных. Это действительно предлагает32 х 32 -> 32 умножается, а также32 х 32 -> 64 умножа...

4 ответа

Если вы не уверены, что это хорошая идея, просто сделайте ее простой и используйте одну и ту же переменную для всех 3 входов:

ое воображение, или

3 ответа

@Ermlg Хорошая мысль. Есть ли способ узнать наверняка, что реализация связана с памятью? Или какие-либо другие виды границ, например, границы ошибочного прогнозирования или границы ввода / вывода?

те предположим, что у нас есть функция, которая умножает два массива на 1000000 удваивается каждый. В C / C ++ функция выглядит так:

2 ответа

godbolt.org/g/rt67UM

олее простое представление моей проблемы, я хочу преобразовать значение с плавающей запятой в определенный тип v4si (я хочу использовать SIMD Operation для о...

0 ответов

 этот цикл для половины регистра. Практически каждая инструкция AVX2 работает на все 8 поплавков.

3 ответа

SSE умножение 2 64-битных целых

Как умножить два 64-разрядных числа на еще 2 64-разрядных числа? Я не нашел ни одной инструкции, которая могла бы это сделать.

4 ответа

Предварительная выборка затруднительна и редко помогает.