Результаты поиска по запросу "avx"

2 ответа

производительность SSE и AVX, когда ширина полосы памяти ограничена

В приведенном ниже коде я изменилdataLen» и получить другую эффективность.dataLen = 400 SSE время: 758000 долларов США AVX время: 483000 долларов США SSE>...

2 ответа

FMA3 в GCC: как включить

У меня есть i5-4250U, который имеет AVX2 и FMA3. Я тестирую код плотного матричного умножения в GCC 4.8.1 для Linux, который я написал. Ниже приведен список трех разных способов компиляции. SSE2: gcc matrix.cpp -o matrix_gcc -O3 -msse2 -fopenmp ...

2 ответа

В чем разница между vextracti128 и vextractf128?

vextracti128 а такжеvextractf128 имеют одинаковую функциональность, параметры и возвращаемые значения. Кроме того, один из них - набор инструкций AVX, а другой - AVX2. В чем разница?

ТОП публикаций

3 ответа

Как выполнить поэлементное смещение влево с помощью __m128i?

1 ответ

@PeterCordes Должен ли я превратить этот ответ в вики сообщества, чтобы вы могли вставить свой ответ здесь? К сожалению, я не могу не принять мой ответ.

у некоторыеAVX код и мне нужно загрузить из потенциально невыровненной памяти. Я сейчас загружаю 4двойникиследовательно, я бы использовал внутреннюю инструкцию _mm256, _loadu_pd [https://software.intel.com/en-us/node/524102]; код, который ...

2 ответа

В чем разница между vextracti128 и vextractf128?

1 ответ

Intel SIMD - как я могу проверить, содержит ли __m256 * ненулевые значения

Я использую компилятор Microsoft Visual Studio. Я пытаюсь выяснить, содержит ли 256-битный вектор ненулевые значения. я пытался

2 ответа

Пропускная способность памяти L1: снижение эффективности на 50% при использовании адресов, которые отличаются на 4096 + 64 байта

2 ответа

производительность SSE и AVX, когда ширина полосы памяти ограничена

В приведенном ниже коде я изменил «dataLen» и получил другую эффективность. dataLen = 400 SSE время: 758000 долларов США AVX время: 483000 долларов США SSE> AVX dataLen = 2400 SSE время: 4212000 сша AVX время: 2636000 сша SSE> AVX dataLen = ...

2 ответа

Реверсировать регистр AVX, содержащий двойные числа, используя единственный внутренний AVX

Если у меня есть регистр AVX с 4 двойными в них, и я хочу сохранить обратное в другом регистре, возможно ли это сделать с помощью одной встроенной команды? Например: если бы у меня было 4 числа с плавающей точкой в регистре SSE, я мог бы ...