Результаты поиска по запросу "avx"
производительность SSE и AVX, когда ширина полосы памяти ограничена
В приведенном ниже коде я изменилdataLen» и получить другую эффективность.dataLen = 400 SSE время: 758000 долларов США AVX время: 483000 долларов США SSE>...
FMA3 в GCC: как включить
У меня есть i5-4250U, который имеет AVX2 и FMA3. Я тестирую код плотного матричного умножения в GCC 4.8.1 для Linux, который я написал. Ниже приведен список трех разных способов компиляции. SSE2: gcc matrix.cpp -o matrix_gcc -O3 -msse2 -fopenmp ...
В чем разница между vextracti128 и vextractf128?
vextracti128 а такжеvextractf128 имеют одинаковую функциональность, параметры и возвращаемые значения. Кроме того, один из них - набор инструкций AVX, а другой - AVX2. В чем разница?
@PeterCordes Должен ли я превратить этот ответ в вики сообщества, чтобы вы могли вставить свой ответ здесь? К сожалению, я не могу не принять мой ответ.
у некоторыеAVX код и мне нужно загрузить из потенциально невыровненной памяти. Я сейчас загружаю 4двойникиследовательно, я бы использовал внутреннюю инструкцию _mm256, _loadu_pd [https://software.intel.com/en-us/node/524102]; код, который ...
Intel SIMD - как я могу проверить, содержит ли __m256 * ненулевые значения
Я использую компилятор Microsoft Visual Studio. Я пытаюсь выяснить, содержит ли 256-битный вектор ненулевые значения. я пытался
производительность SSE и AVX, когда ширина полосы памяти ограничена
В приведенном ниже коде я изменил «dataLen» и получил другую эффективность. dataLen = 400 SSE время: 758000 долларов США AVX время: 483000 долларов США SSE> AVX dataLen = 2400 SSE время: 4212000 сша AVX время: 2636000 сша SSE> AVX dataLen = ...
Реверсировать регистр AVX, содержащий двойные числа, используя единственный внутренний AVX
Если у меня есть регистр AVX с 4 двойными в них, и я хочу сохранить обратное в другом регистре, возможно ли это сделать с помощью одной встроенной команды? Например: если бы у меня было 4 числа с плавающей точкой в регистре SSE, я мог бы ...