Результаты поиска по запросу "avx2"

AVX2, Как эффективно загрузить четыре целых числа в четные индексы 256-битного регистра и копировать в нечетные индексы?

macos avx sse

2 ответа

Какая минимальная версия OS X для использования с AVX / AVX2?

ТОП публикаций

How to write controller in Odoo 12

EHR Software Development: What you need to know [SPDLoad Full Guide]

Любимый шрифт свинки Пеппы и как его сделать

Test Test Test Test Test Test

c++vectorization

1 ответ

Могу ли я использовать AVX FMA для точного 52-битного умножения?

AXV2 не имеет целочисленных умножений с источниками больше 32-битных. Это действительно предлагает32 х 32 -> 32 умножается, а также32 х 32 -> 64 умножа...

c++vectorization x86

0 ответов

с:Какова наиболее эффективная последовательность для генерации набора из 3-х элементов из памяти? Если память устроена так: MEM = R0 G0 B0 R1 G1 B1 R2 G2 B2 R3 G3 B3 ...Мы хотим получить три регистра YMM, где: YMM0 = R0 R1 R2 R3 R4 R5 R6 R7 ...

floating-point c++algorithm logarithm

2 ответа

re: константы: если вы тестируете в цикле, хороший компилятор поднимет нагрузку большинства из них (в регистры вне цикла), поэтому не имеет значения, находятся они рядом со столом или нет. Если они не все подходят, то некоторые должны будут оставаться горячими в кеше.

х__m256d _mm256_log2_pd (__m256d a) недоступна на других компиляторах, кроме Intel, и они говорят, что его производительность ограничена на процессорах AMD. В Интернете есть несколько реализаций, указанных вОтсутствует встроенная логика AVX ...

simd c++x86

1 ответ

директивы ассемблера (16-битные блоки) вместо

ли (быстрый) способ выполнить биты, обратные 32-битным значениям int в регистре avx2? Например. _mm256_set1_epi32(2732370386); <do something here> //binary: 10100010110111001010100111010010 => 1001011100101010011101101000101 //register contains ...

avx simd exponential x86

3 ответа

меньший диапазон. Это тот же трюк в обратном порядке, который вы используете для log (x): извлеките экспоненту ввода, чтобы получить log2 (integer_part (x)).

эффективное (быстрое) приближение экспоненциальной функции, работающей с элементами AVX (плавающая точка одинарной точности). А именно -__m256 _mm256_exp_ps( __m256 x ) без SVML. Относительная точность должна быть примерно равна ~ 1e-6 или ~ 20 ...

c++vectorization visual-studio-2012

3 ответа

/ Arch: AVX включает AVX2?

Я не могу найти ответ на этот простой вопрос,/arch:AVX включить AVX2 с его причудливыми 256-битными регистрами в Visual Studio 2012 Update 4? Направление мысли: Да, он включает AVX, потому что VS не упоминает AVX2. Но я думаю, что VS ...

Страница 2 из 3

123

Результаты поиска по запросу "avx2"

Где VPERMB в AVX2?

AVX2, Как эффективно загрузить четыре целых числа в четные индексы 256-битного регистра и копировать в нечетные индексы?

Какая минимальная версия OS X для использования с AVX / AVX2?

Популярные теги

ТОП публикаций

Авто-векторизация сравнения

Могу ли я использовать AVX FMA для точного 52-битного умножения?

Набор инструкций.

директивы ассемблера (16-битные блоки) вместо

меньший диапазон. Это тот же трюк в обратном порядке, который вы используете для log (x): извлеките экспоненту ввода, чтобы получить log2 (integer_part (x)).

/ Arch: AVX включает AVX2?

Вы очень активны! Это здорово!

Результаты поиска по запросу "avx2"

Популярные теги

ТОП публикаций