Результаты поиска по запросу "avx"

3 ответа

_Mm_broadcast_ss быстрее, чем _mm_set1_ps?

Это код float a = ...; __m256 b = _mm_broadcast_ss(&a)всегда быстрее, чем этот код float a = ...; _mm_set1_ps(a)? Что, еслиa определяется какstatic const float a = ... скорее, чемfloat a = ...?

3 ответа

_Mm_broadcast_ss быстрее, чем _mm_set1_ps?

3 ответа

Как выполнить поэлементное смещение влево с помощью __m128i?

ТОП публикаций

5 ответов

Как использовать AVX / pclmulqdq в Mac OS X

Я пытаюсь скомпилировать программу, которая использует инструкцию pclmulqdq, присутствующую в новых процессорах Intel. Я установил GCC 4.6, используя macports, но когда я компилирую свою программу (которая использует ...

3 ответа

Самый быстрый способ сделать горизонтальную векторную сумму с помощью инструкций AVX [дубликат]

На этот вопрос уже есть ответ здесь: Получить сумму значений, хранящихся в __m256d с помощью SSE / AVX [/questions/49941645/get-sum-of-values-stored-in-m256d-with-sse-avx] 2 ответаУ меня есть упакованный вектор из четырех 64-битных значений с ...

1 ответ

SSE загружает целые в __m128

Каковы особенности GCC для загрузки 4ints в__m128 и 8 дюймов в__m256 (Выровнены / невыровненной)? Что оunsigned ints?

2 ответа

Использование инструкций процессора AVX: низкая производительность без «/ arch: AVX»

Мой код на C ++ использует SSE, и теперь я хочу улучшить его для поддержки AVX, когда он будет доступен. Поэтому я определяю, когда доступен AVX, и вызываю функцию, которая использует команды AVX. Я использую Win7 SP1 + VS2010 SP1 и процессор с ...

5 ответов

флаги: FPU VME-де-псевдоэфедрин TSC MSR пае MCE CX8 APIC SEP MTRR PGE MCA CMOV погладить pse36 clflush MMX fxsr ссе sse2 ХТ системный вызов пх pdpe1gb rdtscp лм constant_tsc rep_good nopl xtopology nonstop_tsc aperfmperf eagerfpu ПНИ PCLMULQDQ SSSE3 FMA CX16 PCID sse4_1 sse4_2 x2APIC movbe POPCNT tsc_deadline_timer АЕС xsave avx f16c гипервизор rdrand lahf_lm abm 3dnowprefetch invpcid_single retpoline kaiser fsgsbase bmi1 hle avx2 smep bmi2 erms invpcid rtm rdseed adx xsaveopt

вителен ли следующий код для проверки, поддерживает ли ЦП набор команд SSE3? С помощьюIsProcessorFeaturePresent() функция видимо не работает на Windows ...

1 ответ

Спасибо за ссылку на документ.

у сеть прямой связи в VC ++ с использованием встроенных функций AVX. Я вызываю этот код через PInvoke в C #. Моя производительность при вызове функции, которая вычисляет большой цикл, включая функцию exp (), составляет ~ 1000 мс при размере петли ...

1 ответ

В конце концов я взломал и скачал Xcode 4 - похоже, Clang - единственный компилятор, который может поддерживать AVX в настоящее время, хотя я не проверял его должным образом:

е чем тратить время и деньги на загрузку Xcode 4, кто-нибудь может сказать мне, поставляется ли он с версией gcc (или любым другим компилятором, например, LLVM), который поддерживает набор инструкций AVX на процессорах Sandy Bridge (т.е.gcc -mavx ...