Результаты поиска по запросу "fma"

2 ответа

Инструкция FMA _mm256_fmadd_pd (): «132», «231» и «213»?

Может ли кто-нибудь объяснить мне, почему существует 3 варианта объединенной инструкции умножения и накопления:

0 ответов

Как получить данные из регистров AVX?

Используя MSVC 2013 и AVX 1, у меня есть 8 поплавков в регистре:

3 ответа

Могу ли я использовать AVX FMA для точного 52-битного умножения?

AXV2 не имеет целочисленных умножений с источниками больше 32-битных. Это действительно предлагает32 х 32 -> 32 умножается, а также32 х 32 -> 64 умножа...

ТОП публикаций

2 ответа

Предотвращение автоматического использования GCC инструкций AVX и FMA при компиляции с -mavx и -mfma

Как я могу отключить автоматическую векторизацию с помощью инструкций AVX и FMA? Я бы все же предпочел, чтобы компилятор использовал SSE и SSE2 автоматически, но не FMA и AVX. Мой код, который использует AVX, проверяет его доступность, но GCC не ...

2 ответа

FMA3 в GCC: как включить

У меня есть i5-4250U, который имеет AVX2 и FMA3. Я тестирую код плотного матричного умножения в GCC 4.8.1 для Linux, который я написал. Ниже приведен список трех разных способов компиляции. SSE2: gcc matrix.cpp -o matrix_gcc -O3 -msse2 -fopenmp ...

1 ответ

fmad = false дает хорошую производительность

Из примечаний к выпуску Nvidia: The nvcc compiler switch, --fmad (short name: -fmad), to control the contraction of floating-point multiplies and add/subtracts into floating-point multiply-add operations (FMAD, FFMA, or DFMA) has been added: ...

2 ответа

Есть ли сценарий, где можно использовать функцию FMA в libc?

Я сталкиваюсьэта страница [http://sourceware.org/newlib/libm.html#fma]и найти там странныйумножение с плавающей запятой функция -fma а такжеfmaf, Это говорит о том, что результат примерно такой: (x * y) + z #fma(x,y,z)И значениебесконечная ...