Результаты поиска по запросу "avx"

2 ответа

Отсутствует встроенная логика AVX (_mm256_log_ps) в g ++ - 4.8?

Я пытаюсь использовать некоторые встроенные функции AVX в своем коде и натолкнулся на кирпичную стену со встроенными логарифмами.Используя Intel Intrinsics G...

2 ответа

Предотвращение автоматического использования GCC инструкций AVX и FMA при компиляции с -mavx и -mfma

2 ответа

В чем разница между vextracti128 и vextractf128?

ТОП публикаций

2 ответа

Использование SIMD / AVX / SSE для обхода дерева

В настоящее время я исследую, возможно ли ускорить обход дерева Ван Эмде Боаса (или любого дерева). Учитывая один поисковый запрос в качестве входных данных,...

2 ответа

FMA3 в GCC: как включить

2 ответа

Как использовать инструкции Fused Multiply-Add (FMA) с SSE / AVX

Я узнал, что некоторые процессоры Intel / AMD могут выполнять одновременное умножение и добавление с помощью SSE / AVX: FLOPS за цикл для песчаного моста и скважины SSE2 / AVX / ...

2 ответа

Взаимодействие SIMD (SSE / AVX) с GCC

Мне удалось преобразовать большую часть моего кода SIMD в векторные расширения GCC. Однако я не нашел хорошего решения для трансляции следующим образом

1 ответ

Неожиданно хорошая производительность с параллелью openmp для цикла

Я отредактировал свой вопрос после предыдущих комментариев (особенно @Zboson) для лучшей читаемостиЯ всегда действовал и следовал общепринятому мнению, что ч...

3 ответа

Есть ли более эффективный способ транслировать 4 смежных дубли в 4 регистра YMM?

В фрагменте кода C ++, который выполняет что-то похожее (но не совсем) умножение матриц, я загружаю 4 смежных двойных числа в 4 регистра YMM следующим образом:

1 ответ

Самый быстрый способ распаковать 32 бита в 32-байтовый вектор SIMD

32 бита хранятся в