Результаты поиска по запросу "avx"
_Mm_broadcast_ss быстрее, чем _mm_set1_ps?
Это код float a = ...; __m256 b = _mm_broadcast_ss(&a)всегда быстрее, чем этот код float a = ...; _mm_set1_ps(a)? Что, еслиa определяется какstatic const float a = ... скорее, чемfloat a = ...?
Как использовать AVX / pclmulqdq в Mac OS X
Я пытаюсь скомпилировать программу, которая использует инструкцию pclmulqdq, присутствующую в новых процессорах Intel. Я установил GCC 4.6, используя macports, но когда я компилирую свою программу (которая использует ...
Самый быстрый способ сделать горизонтальную векторную сумму с помощью инструкций AVX [дубликат]
На этот вопрос уже есть ответ здесь: Получить сумму значений, хранящихся в __m256d с помощью SSE / AVX [/questions/49941645/get-sum-of-values-stored-in-m256d-with-sse-avx] 2 ответаУ меня есть упакованный вектор из четырех 64-битных значений с ...
SSE загружает целые в __m128
Каковы особенности GCC для загрузки 4ints в__m128 и 8 дюймов в__m256 (Выровнены / невыровненной)? Что оunsigned ints?
Использование инструкций процессора AVX: низкая производительность без «/ arch: AVX»
Мой код на C ++ использует SSE, и теперь я хочу улучшить его для поддержки AVX, когда он будет доступен. Поэтому я определяю, когда доступен AVX, и вызываю функцию, которая использует команды AVX. Я использую Win7 SP1 + VS2010 SP1 и процессор с ...
флаги: FPU VME-де-псевдоэфедрин TSC MSR пае MCE CX8 APIC SEP MTRR PGE MCA CMOV погладить pse36 clflush MMX fxsr ссе sse2 ХТ системный вызов пх pdpe1gb rdtscp лм constant_tsc rep_good nopl xtopology nonstop_tsc aperfmperf eagerfpu ПНИ PCLMULQDQ SSSE3 FMA CX16 PCID sse4_1 sse4_2 x2APIC movbe POPCNT tsc_deadline_timer АЕС xsave avx f16c гипервизор rdrand lahf_lm abm 3dnowprefetch invpcid_single retpoline kaiser fsgsbase bmi1 hle avx2 smep bmi2 erms invpcid rtm rdseed adx xsaveopt
вителен ли следующий код для проверки, поддерживает ли ЦП набор команд SSE3? С помощьюIsProcessorFeaturePresent() функция видимо не работает на Windows ...
Спасибо за ссылку на документ.
у сеть прямой связи в VC ++ с использованием встроенных функций AVX. Я вызываю этот код через PInvoke в C #. Моя производительность при вызове функции, которая вычисляет большой цикл, включая функцию exp (), составляет ~ 1000 мс при размере петли ...
В конце концов я взломал и скачал Xcode 4 - похоже, Clang - единственный компилятор, который может поддерживать AVX в настоящее время, хотя я не проверял его должным образом:
е чем тратить время и деньги на загрузку Xcode 4, кто-нибудь может сказать мне, поставляется ли он с версией gcc (или любым другим компилятором, например, LLVM), который поддерживает набор инструкций AVX на процессорах Sandy Bridge (т.е.gcc -mavx ...