Результаты поиска по запросу "avx"

4 ответа

статические / статические локальные переменные SSE / AVX блокируют регистр xmm / ymm?

При использовании встроенных функций SSE часто требуются нулевые векторы. Один из способов избежать создания нулевой переменной внутри функции всякий раз, ко...

1 ответ

@Zboson: GPU mandelbrot, вероятно, не о масштабировании или его полезности, а скорее о хорошо известной и простой проблеме с очень высокой вычислительной интенсивностью / низкой пропускной способностью памяти. (И цепочка зависимости данных, которая может ограничивать ILP). На этой странице были и другие ориентиры, но мне нравится Мандельброт.

ли выполнить арифметику с плавающей запятой половинной точности на чипах Intel? Я знаю, как загружать / хранить / преобразовывать числа с плавающей запятой половинной точности [1], но я не знаю, как добавить / умножить их без преобразования в ...

1 ответ

AVX внутри виртуальной машины VirtualBox?

Я устанавливаю последнюю версию Ubuntu 14.04 amd64 (gcc 4.8.2) в virtualbox, запускаю cat / proc / cpuinfo, получаю результат:Процессор CORE i52520M поддержи...

ТОП публикаций

1 ответ

, но он поддерживает другие встроенные функции в моем коде.

тирую следующую простую функцию

2 ответа

Отсутствует встроенная логика AVX (_mm256_log_ps) в g ++ - 4.8?

Я пытаюсь использовать некоторые встроенные функции AVX в своем коде и натолкнулся на кирпичную стену со встроенными логарифмами.Используя Intel Intrinsics G...

1 ответ

Проверка, поддерживается ли SSE во время выполнения [duplicate]

1 ответ

AVX2, Как эффективно загрузить четыре целых числа в четные индексы 256-битного регистра и копировать в нечетные индексы?

5 ответов

флаги: FPU VME-де-псевдоэфедрин TSC MSR пае MCE CX8 APIC SEP MTRR PGE MCA CMOV погладить pse36 clflush MMX fxsr ссе sse2 ХТ системный вызов пх pdpe1gb rdtscp лм constant_tsc rep_good nopl xtopology nonstop_tsc aperfmperf eagerfpu ПНИ PCLMULQDQ SSSE3 FMA CX16 PCID sse4_1 sse4_2 x2APIC movbe POPCNT tsc_deadline_timer АЕС xsave avx f16c гипервизор rdrand lahf_lm abm 3dnowprefetch invpcid_single retpoline kaiser fsgsbase bmi1 hle avx2 smep bmi2 erms invpcid rtm rdseed adx xsaveopt

вителен ли следующий код для проверки, поддерживает ли ЦП набор команд SSE3? С помощьюIsProcessorFeaturePresent() функция видимо не работает на Windows ...

1 ответ

 это 2 мопс. (И вызывает остановку перехода SSE / AVX на Haswell, но не Skylake). Кроме того, все эти операции являются частью цепочки зависимостей для изменяемого регистра, в отличие от установки значения в другом регистре и смешивания.

состоит в том, что я хотел бы собрать возвращенные значенияdouble в векторный регистр для обработки для машиныimm width вовремябезСохранение обратно в память первым. Конкретная обработка являетсяvfma с двумя другими операндами, ...

1 ответ

Разница между инструкциями AVX vxorpd и vpxor