Результаты поиска по запросу "simd"

3 ответа

Сжатие разреженного массива с использованием SIMD (AVX2)

У меня есть редкий массив

2 ответа

В чем разница между vextracti128 и vextractf128?

1 ответ

C ++ SSE реализация фильтра

Я пытался использовать SSE, чтобы сделать операцию 4 пикселей. У меня проблема с загрузкой данных изображения в __m128. Мои данные изображения представляют с...

ТОП публикаций

2 ответа

Использование SIMD / AVX / SSE для обхода дерева

В настоящее время я исследую, возможно ли ускорить обход дерева Ван Эмде Боаса (или любого дерева). Учитывая один поисковый запрос в качестве входных данных,...

2 ответа

Общие методы SIMD

Где я могу найти информацию о распространенных трюках SIMD? У меня есть набор инструкций, и я знаю, как написать не хитрый SIMD-код, но я знаю, что SIMD тепе...

2 ответа

SIMD и разница между упакованной и скалярной двойной точностью

Я читаю руководство по встроенным функциям Intel при реализации поддержки SIMD. У меня есть несколько путаницы, и мои вопросы, как показано ниже. __m128 _mm_cmpeq_ps (__m128 a, __m128 b) Документация говорит, что она используется для сравнения ...

2 ответа

Использует ли gcc инструкции Intel SSE 4.2 для обработки текста, если таковые имеются?

Я читаюВот [http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=5762731&url=http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5762731] что Intel представилаSSE 4.2 instructions для ускорения обработки строк. Цитата из статьи: Набор ...

2 ответа

Взаимодействие SIMD (SSE / AVX) с GCC

Мне удалось преобразовать большую часть моего кода SIMD в векторные расширения GCC. Однако я не нашел хорошего решения для трансляции следующим образом

2 ответа

Авто векторизация не работает

Я пытаюсь заставить мой код автоматически векторизовать, но он не работает.

3 ответа

Есть ли более эффективный способ транслировать 4 смежных дубли в 4 регистра YMM?

В фрагменте кода C ++, который выполняет что-то похожее (но не совсем) умножение матриц, я загружаю 4 смежных двойных числа в 4 регистра YMM следующим образом: