Результаты поиска по запросу "avx"
Отсутствует встроенная логика AVX (_mm256_log_ps) в g ++ - 4.8?
Я пытаюсь использовать некоторые встроенные функции AVX в своем коде и натолкнулся на кирпичную стену со встроенными логарифмами.Используя Intel Intrinsics G...
Использование SIMD / AVX / SSE для обхода дерева
В настоящее время я исследую, возможно ли ускорить обход дерева Ван Эмде Боаса (или любого дерева). Учитывая один поисковый запрос в качестве входных данных,...
Как использовать инструкции Fused Multiply-Add (FMA) с SSE / AVX
Я узнал, что некоторые процессоры Intel / AMD могут выполнять одновременное умножение и добавление с помощью SSE / AVX: FLOPS за цикл для песчаного моста и скважины SSE2 / AVX / ...
Взаимодействие SIMD (SSE / AVX) с GCC
Мне удалось преобразовать большую часть моего кода SIMD в векторные расширения GCC. Однако я не нашел хорошего решения для трансляции следующим образом
Неожиданно хорошая производительность с параллелью openmp для цикла
Я отредактировал свой вопрос после предыдущих комментариев (особенно @Zboson) для лучшей читаемостиЯ всегда действовал и следовал общепринятому мнению, что ч...
Есть ли более эффективный способ транслировать 4 смежных дубли в 4 регистра YMM?
В фрагменте кода C ++, который выполняет что-то похожее (но не совсем) умножение матриц, я загружаю 4 смежных двойных числа в 4 регистра YMM следующим образом: