Результаты поиска по запросу "simd"

Я пытаюсь умножить два вектора вместе, где каждый элемент одного вектора умножается на элемент в том же индексе в другом векторе. Затем я хочу суммировать вс...

tensorflow compiler-options x86 compiler-optimization

11 ответов

Как скомпилировать Tensorflow с инструкциями SSE4.2 и AVX?

Это сообщение получено от запуска скрипта, чтобы проверить, работает ли Tensorflow:

x86 sse avx

0 ответов

Конвенция для отображения векторных регистров

ТОП публикаций

10 Food Delivery Startups to Watch for in 2020

7 Best Telemedicine Apps In 2020

How to Build a Live Streaming Video App and Reach Founder’s Zen

19 Tools And Resources to Build an MVP From Scratch

floating-point fma x86 avx2

3 ответа

Могу ли я использовать AVX FMA для точного 52-битного умножения?

AXV2 не имеет целочисленных умножений с источниками больше 32-битных. Это действительно предлагает32 х 32 -> 32 умножается, а также32 х 32 -> 64 умножа...

x86 sse avx

4 ответа

Если вы не уверены, что это хорошая идея, просто сделайте ее простой и используйте одну и ту же переменную для всех 3 входов:

ое воображение, или

c++performance assembly

3 ответа

@Ermlg Хорошая мысль. Есть ли способ узнать наверняка, что реализация связана с памятью? Или какие-либо другие виды границ, например, границы ошибочного прогнозирования или границы ввода / вывода?

те предположим, что у нас есть функция, которая умножает два массива на 1000000 удваивается каждый. В C / C ++ функция выглядит так:

gcc c sse x86

2 ответа

godbolt.org/g/rt67UM

олее простое представление моей проблемы, я хочу преобразовать значение с плавающей запятой в определенный тип v4si (я хочу использовать SIMD Operation для о...