Результаты поиска по запросу "avx"

1 ответ

Загрузка 8 символов из памяти в переменную __m256 как упакованные числа с плавающей запятой одинарной точности

Я оптимизирую алгоритм размытия по Гауссу на изображении и хочу заменить использование плавающего буфера [8] в приведенном ниже коде встроенной переменной __...

1 ответ

Каковы лучшие последовательности команд для генерации векторных констант на лету?

«Наилучший» означает наименьшее количество инструкций (или наименьшее количество мопов, если какие-либо инструкции декодируются в более чем один моп). Размер...

2 ответа

Индексы ненулевых байтов регистра SSE / AVX

ТОП публикаций

5 ответов

SSE-copy, AVX-copy и std :: copy производительность

Я пытался улучшить производительность операции копирования через SSE и AVX: #include <immintrin.h> const int sz = 1024; float *mas = (float *)_mm_malloc(sz*sizeof(float), 16); float *tar = (float *)_mm_malloc(sz*sizeof(float), 16); float a=0; ...

1 ответ

Самый эффективный способ получить __m256 горизонтальных сумм из 8 исходных __m256 векторов

Я знаю как подвести итог

1 ответ

Где Кланг '_mm256_pow_ps' свойственный?

Кажется, я не могу найти встроенные функции для _mm_pow_ps или _mm256_pow_ps, оба из которых должны быть включены в immintrin.h.Clang не определяет их или он...

0 ответов

Как получить данные из регистров AVX?

Используя MSVC 2013 и AVX 1, у меня есть 8 поплавков в регистре:

1 ответ

Новый синтаксис AVX-инструкций

1 ответ

AVX2, Как эффективно загрузить четыре целых числа в четные индексы 256-битного регистра и копировать в нечетные индексы?

2 ответа

Какая минимальная версия OS X для использования с AVX / AVX2?