Результаты поиска по запросу "avx"

4 ответа

Примеры и учебные пособия по Intel SSE и AVX [закрыто]

4 ответа

горизонтальная сумма 8 упакованных 32-битных чисел

Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (

4 ответа

статические / статические локальные переменные SSE / AVX блокируют регистр xmm / ymm?

При использовании встроенных функций SSE часто требуются нулевые векторы. Один из способов избежать создания нулевой переменной внутри функции всякий раз, ко...

ТОП публикаций

4 ответа

Если вы не уверены, что это хорошая идея, просто сделайте ее простой и используйте одну и ту же переменную для всех 3 входов:

ое воображение, или

4 ответа

Примеры и учебные пособия по Intel SSE и AVX [закрыто]

Есть ли хорошие учебники или примеры по C / C ++ для изучения инструкций Intel SSE и AVX? Я нашел несколько на сайтах Microsoft MSDN и Intel, но было бы здорово понять это с основ.

4 ответа

горизонтальная сумма 8 упакованных 32-битных чисел

Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (__m256), какой самый быстрый способ извлечь горизонтальную сумму всех 8 элементов? Точно так же, как получить горизонтальный максимум и минимум? Другими словами, какова лучшая ...

5 ответов

SSE-copy, AVX-copy и std :: copy производительность

m попытался улучшить производительность операции копирования через SSE и AVX:

5 ответов

флаги: FPU VME-де-псевдоэфедрин TSC MSR пае MCE CX8 APIC SEP MTRR PGE MCA CMOV погладить pse36 clflush MMX fxsr ссе sse2 ХТ системный вызов пх pdpe1gb rdtscp лм constant_tsc rep_good nopl xtopology nonstop_tsc aperfmperf eagerfpu ПНИ PCLMULQDQ SSSE3 FMA CX16 PCID sse4_1 sse4_2 x2APIC movbe POPCNT tsc_deadline_timer АЕС xsave avx f16c гипервизор rdrand lahf_lm abm 3dnowprefetch invpcid_single retpoline kaiser fsgsbase bmi1 hle avx2 smep bmi2 erms invpcid rtm rdseed adx xsaveopt

вителен ли следующий код для проверки, поддерживает ли ЦП набор команд SSE3? С помощьюIsProcessorFeaturePresent() функция видимо не работает на Windows ...

5 ответов

Как использовать AVX / pclmulqdq в Mac OS X

Я пытаюсь скомпилировать программу, которая использует инструкцию pclmulqdq, присутствующую в новых процессорах Intel. Я установил GCC 4.6, используя macports, но когда я компилирую свою программу (которая использует ...

5 ответов

SSE-copy, AVX-copy и std :: copy производительность

Я пытался улучшить производительность операции копирования через SSE и AVX: #include <immintrin.h> const int sz = 1024; float *mas = (float *)_mm_malloc(sz*sizeof(float), 16); float *tar = (float *)_mm_malloc(sz*sizeof(float), 16); float a=0; ...