Результаты поиска по запросу "avx"

Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (

статические / статические локальные переменные SSE / AVX блокируют регистр xmm / ymm?

При использовании встроенных функций SSE часто требуются нулевые векторы. Один из способов избежать создания нулевой переменной внутри функции всякий раз, ко...

ТОП публикаций

How to write controller in Odoo 12

EHR Software Development: What you need to know [SPDLoad Full Guide]

Любимый шрифт свинки Пеппы и как его сделать

Test Test Test Test Test Test

simd x86 sse

4 ответа

Если вы не уверены, что это хорошая идея, просто сделайте ее простой и используйте одну и ту же переменную для всех 3 входов:

ое воображение, или

vectorization sse intel

4 ответа

Примеры и учебные пособия по Intel SSE и AVX [закрыто]

Есть ли хорошие учебники или примеры по C / C ++ для изучения инструкций Intel SSE и AVX? Я нашел несколько на сайтах Microsoft MSDN и Intel, но было бы здорово понять это с основ.

sse simd x86

4 ответа

горизонтальная сумма 8 упакованных 32-битных чисел

Если у меня есть 8 упакованных 32-битных чисел с плавающей запятой (__m256), какой самый быстрый способ извлечь горизонтальную сумму всех 8 элементов? Точно так же, как получить горизонтальный максимум и минимум? Другими словами, какова лучшая ...

c++performance sse simd

5 ответов

SSE-copy, AVX-copy и std :: copy производительность

m попытался улучшить производительность операции копирования через SSE и AVX:

c++sse instruction-set cpuid

5 ответов

флаги: FPU VME-де-псевдоэфедрин TSC MSR пае MCE CX8 APIC SEP MTRR PGE MCA CMOV погладить pse36 clflush MMX fxsr ссе sse2 ХТ системный вызов пх pdpe1gb rdtscp лм constant_tsc rep_good nopl xtopology nonstop_tsc aperfmperf eagerfpu ПНИ PCLMULQDQ SSSE3 FMA CX16 PCID sse4_1 sse4_2 x2APIC movbe POPCNT tsc_deadline_timer АЕС xsave avx f16c гипервизор rdrand lahf_lm abm 3dnowprefetch invpcid_single retpoline kaiser fsgsbase bmi1 hle avx2 smep bmi2 erms invpcid rtm rdseed adx xsaveopt

вителен ли следующий код для проверки, поддерживает ли ЦП набор команд SSE3? С помощьюIsProcessorFeaturePresent() функция видимо не работает на Windows ...

osx-lion assembly gcc macports

5 ответов

Как использовать AVX / pclmulqdq в Mac OS X

Я пытаюсь скомпилировать программу, которая использует инструкцию pclmulqdq, присутствующую в новых процессорах Intel. Я установил GCC 4.6, используя macports, но когда я компилирую свою программу (которая использует ...

performance simd sse c++

5 ответов

SSE-copy, AVX-copy и std :: copy производительность

Я пытался улучшить производительность операции копирования через SSE и AVX: #include <immintrin.h> const int sz = 1024; float *mas = (float *)_mm_malloc(sz*sizeof(float), 16); float *tar = (float *)_mm_malloc(sz*sizeof(float), 16); float a=0; ...

Страница 9 из 9

5 6 7 89

Вы очень активны! Это здорово!

Результаты поиска по запросу "avx"

Популярные теги

ТОП публикаций