Результаты поиска по запросу "avx"
Спасибо за ссылку на документ.
у сеть прямой связи в VC ++ с использованием встроенных функций AVX. Я вызываю этот код через PInvoke в C #. Моя производительность при вызове функции, которая вычисляет большой цикл, включая функцию exp (), составляет ~ 1000 мс при размере петли ...
В чем разница между vextracti128 и vextractf128?
vextracti128 а такжеvextractf128 имеют одинаковую функциональность, параметры и возвращаемые значения. Кроме того, один из них - набор инструкций AVX, а другой - AVX2. В чем разница?
флаги: FPU VME-де-псевдоэфедрин TSC MSR пае MCE CX8 APIC SEP MTRR PGE MCA CMOV погладить pse36 clflush MMX fxsr ссе sse2 ХТ системный вызов пх pdpe1gb rdtscp лм constant_tsc rep_good nopl xtopology nonstop_tsc aperfmperf eagerfpu ПНИ PCLMULQDQ SSSE3 FMA CX16 PCID sse4_1 sse4_2 x2APIC movbe POPCNT tsc_deadline_timer АЕС xsave avx f16c гипервизор rdrand lahf_lm abm 3dnowprefetch invpcid_single retpoline kaiser fsgsbase bmi1 hle avx2 smep bmi2 erms invpcid rtm rdseed adx xsaveopt
вителен ли следующий код для проверки, поддерживает ли ЦП набор команд SSE3? С помощьюIsProcessorFeaturePresent() функция видимо не работает на Windows ...
Предотвращение автоматического использования GCC инструкций AVX и FMA при компиляции с -mavx и -mfma
Как я могу отключить автоматическую векторизацию с помощью инструкций AVX и FMA? Я бы все же предпочел, чтобы компилятор использовал SSE и SSE2 автоматически, но не FMA и AVX. Мой код, который использует AVX, проверяет его доступность, но GCC не ...
Использование инструкций процессора AVX: низкая производительность без «/ arch: AVX»
Мой код на C ++ использует SSE, и теперь я хочу улучшить его для поддержки AVX, когда он будет доступен. Поэтому я определяю, когда доступен AVX, и вызываю функцию, которая использует команды AVX. Я использую Win7 SP1 + VS2010 SP1 и процессор с ...
FMA3 в GCC: как включить
У меня есть i5-4250U, который имеет AVX2 и FMA3. Я тестирую код плотного матричного умножения в GCC 4.8.1 для Linux, который я написал. Ниже приведен список трех разных способов компиляции. SSE2: gcc matrix.cpp -o matrix_gcc -O3 -msse2 -fopenmp ...
SSE загружает целые в __m128
Каковы особенности GCC для загрузки 4ints в__m128 и 8 дюймов в__m256 (Выровнены / невыровненной)? Что оunsigned ints?
Самый быстрый способ сделать горизонтальную векторную сумму с помощью инструкций AVX [дубликат]
На этот вопрос уже есть ответ здесь: Получить сумму значений, хранящихся в __m256d с помощью SSE / AVX [/questions/49941645/get-sum-of-values-stored-in-m256d-with-sse-avx] 2 ответаУ меня есть упакованный вектор из четырех 64-битных значений с ...
Как использовать AVX / pclmulqdq в Mac OS X
Я пытаюсь скомпилировать программу, которая использует инструкцию pclmulqdq, присутствующую в новых процессорах Intel. Я установил GCC 4.6, используя macports, но когда я компилирую свою программу (которая использует ...
Как сложить __m256 по горизонтали?
Я хотел бы суммировать компоненты по горизонтали__m256 вектор с использованием инструкций AVX. В SSE я мог бы использовать _mm_hadd_ps(xmm,xmm); _mm_hadd_ps(xmm,xmm);чтобы получить результат в первом компоненте вектора, но это не масштабируется ...