Результаты поиска по запросу "avx"

1 ответ

Проверка, поддерживается ли SSE во время выполнения [duplicate]

1 ответ

AVX: выравнивание данных: сбой хранилища, хранилище, загрузка, загрузка не

Я модифицирую RNNLM нейронную сеть для изучения языковой модели. Однако, учитывая размер моего корпуса, он работает очень медленно. Я пытался оптимизировать ...

1 ответ

Оболочка для `__m256`, создающая ошибку сегментации с помощью конструктора - Windows 64 + MinGW + AVX

У меня есть профсоюз, который выглядит так

ТОП публикаций

1 ответ

Сколько тактов стоит возведение в степень AVX / SSE на современном процессоре x86_64?

Сколько тактов стоит возведение в степень AVX / SSE на современном процессоре x86_64?Я о:

1 ответ

Загрузка 8 символов из памяти в переменную __m256 как упакованные числа с плавающей запятой одинарной точности

Я оптимизирую алгоритм размытия по Гауссу на изображении и хочу заменить использование плавающего буфера [8] в приведенном ниже коде встроенной переменной __...

1 ответ

Каковы лучшие последовательности команд для генерации векторных констант на лету?

«Наилучший» означает наименьшее количество инструкций (или наименьшее количество мопов, если какие-либо инструкции декодируются в более чем один моп). Размер...

1 ответ

Самый эффективный способ получить __m256 горизонтальных сумм из 8 исходных __m256 векторов

Я знаю как подвести итог

1 ответ

Где Кланг '_mm256_pow_ps' свойственный?

Кажется, я не могу найти встроенные функции для _mm_pow_ps или _mm256_pow_ps, оба из которых должны быть включены в immintrin.h.Clang не определяет их или он...

1 ответ

Новый синтаксис AVX-инструкций

1 ответ

AVX2, Как эффективно загрузить четыре целых числа в четные индексы 256-битного регистра и копировать в нечетные индексы?