Результаты поиска по запросу "avx2"
Могу ли я использовать AVX FMA для точного 52-битного умножения?
AXV2 не имеет целочисленных умножений с источниками больше 32-битных. Это действительно предлагает32 х 32 -> 32 умножается, а также32 х 32 -> 64 умножа...
Набор инструкций.
с:Какова наиболее эффективная последовательность для генерации набора из 3-х элементов из памяти? Если память устроена так: MEM = R0 G0 B0 R1 G1 B1 R2 G2 B2 R3 G3 B3 ...Мы хотим получить три регистра YMM, где: YMM0 = R0 R1 R2 R3 R4 R5 R6 R7 ...
re: константы: если вы тестируете в цикле, хороший компилятор поднимет нагрузку большинства из них (в регистры вне цикла), поэтому не имеет значения, находятся они рядом со столом или нет. Если они не все подходят, то некоторые должны будут оставаться горячими в кеше.
х__m256d _mm256_log2_pd (__m256d a) недоступна на других компиляторах, кроме Intel, и они говорят, что его производительность ограничена на процессорах AMD. В Интернете есть несколько реализаций, указанных вОтсутствует встроенная логика AVX ...
директивы ассемблера (16-битные блоки) вместо
ли (быстрый) способ выполнить биты, обратные 32-битным значениям int в регистре avx2? Например. _mm256_set1_epi32(2732370386); <do something here> //binary: 10100010110111001010100111010010 => 1001011100101010011101101000101 //register contains ...
меньший диапазон. Это тот же трюк в обратном порядке, который вы используете для log (x): извлеките экспоненту ввода, чтобы получить log2 (integer_part (x)).
эффективное (быстрое) приближение экспоненциальной функции, работающей с элементами AVX (плавающая точка одинарной точности). А именно -__m256 _mm256_exp_ps( __m256 x ) без SVML. Относительная точность должна быть примерно равна ~ 1e-6 или ~ 20 ...
/ Arch: AVX включает AVX2?
Я не могу найти ответ на этот простой вопрос,/arch:AVX включить AVX2 с его причудливыми 256-битными регистрами в Visual Studio 2012 Update 4? Направление мысли: Да, он включает AVX, потому что VS не упоминает AVX2. Но я думаю, что VS ...