Результаты поиска по запросу "avx"

Я хочу векторизовать умножение двух выровненных массивов памяти. Я не нашел способа умножить 64 * 64 бит в AVX / AVX2, поэтому я просто развернул петлю и загрузил / сохранил AVX2. Есть ли более быстрый способ сделать это? Заметка Я не хочу ...

clang sse

1 ответ

Где Кланг '_mm256_pow_ps' свойственный?

Кажется, я не могу найти встроенные функции для _mm_pow_ps или _mm256_pow_ps, оба из которых должны быть включены в immintrin.h.Clang не определяет их или он...

x86 intrinsics avx2 icc

1 ответ

Есть ли обратная инструкция к инструкции Movemask в Intel AVX2?

Инструкция (и) movemask берут __m256i и возвращают int32, где каждый бит (либо первые 4, 8 или все 32 бита в зависимости от типа входного векторного элемента) является старшим значащим битом соответствующего векторного элемента. Я хотел бы ...

ТОП публикаций

10 Food Delivery Startups to Watch for in 2020

7 Best Telemedicine Apps In 2020

How to Build a Live Streaming Video App and Reach Founder’s Zen

19 Tools And Resources to Build an MVP From Scratch

matrix sse sum c++

1 ответ

Самый эффективный способ получить m256 горизонтальных сумм из 8 исходных m256 векторов

Я знаю как подвести итог

x86 sse4 c simd

1 ответ

_mm_testc_ps и _mm_testc_pd vs _mm_testc_si128

Как вы знаете, первые два относятся к спецификациям AVX, а вторая - к SSE4.1. Оба набора встроенных функций могут использоваться для проверки на равенство 2 векторов с плавающей точкой. Мой конкретный вариант использования: _mm_cmpeq_ps ...

sse simd c c++

2 ответа

Индексы ненулевых байтов регистра SSE / AVX

x86 assembly sse simd

1 ответ

Каковы лучшие последовательности команд для генерации векторных констант на лету?

«Наилучший» означает наименьшее количество инструкций (или наименьшее количество мопов, если какие-либо инструкции декодируются в более чем один моп). Размер...

avx2 simd sse c++

1 ответ

Загрузка 8 символов из памяти в переменную __m256 как упакованные числа с плавающей запятой одинарной точности

Я оптимизирую алгоритм размытия по Гауссу на изображении и хочу заменить использование плавающего буфера [8] в приведенном ниже коде встроенной переменной __...

x86 c++fma visual-c++

2 ответа

Автоматически генерировать инструкции FMA в MSVC

MSVC поддерживает инструкции AVX / AVX2 в течение многих лет и в соответствии сэто сообщение в блоге msdn, он может автоматически генерироватьсплавлено-умнож...

visual-c++simd sse auto-vectorization

2 ответа

Как написать код на C ++, который компилятор может эффективно компилировать в SSE или AVX?

Страница 3 из 9

1 234 5

Результаты поиска по запросу "avx"

Самый быстрый способ умножения массива int64_t?

Где Кланг '_mm256_pow_ps' свойственный?

Есть ли обратная инструкция к инструкции Movemask в Intel AVX2?

Популярные теги

ТОП публикаций

Самый эффективный способ получить m256 горизонтальных сумм из 8 исходных m256 векторов

_mm_testc_ps и _mm_testc_pd vs _mm_testc_si128

Индексы ненулевых байтов регистра SSE / AVX

Каковы лучшие последовательности команд для генерации векторных констант на лету?

Загрузка 8 символов из памяти в переменную __m256 как упакованные числа с плавающей запятой одинарной точности

Автоматически генерировать инструкции FMA в MSVC

Как написать код на C ++, который компилятор может эффективно компилировать в SSE или AVX?

Вы очень активны! Это здорово!

Результаты поиска по запросу "avx"

Популярные теги

ТОП публикаций