Результаты поиска по запросу "simd"
Сжатие разреженного массива с использованием SIMD (AVX2)
У меня есть редкий массив
C ++ SSE реализация фильтра
Я пытался использовать SSE, чтобы сделать операцию 4 пикселей. У меня проблема с загрузкой данных изображения в __m128. Мои данные изображения представляют с...
Использование SIMD / AVX / SSE для обхода дерева
В настоящее время я исследую, возможно ли ускорить обход дерева Ван Эмде Боаса (или любого дерева). Учитывая один поисковый запрос в качестве входных данных,...
Общие методы SIMD
Где я могу найти информацию о распространенных трюках SIMD? У меня есть набор инструкций, и я знаю, как написать не хитрый SIMD-код, но я знаю, что SIMD тепе...
SIMD и разница между упакованной и скалярной двойной точностью
Я читаю руководство по встроенным функциям Intel при реализации поддержки SIMD. У меня есть несколько путаницы, и мои вопросы, как показано ниже. __m128 _mm_cmpeq_ps (__m128 a, __m128 b) Документация говорит, что она используется для сравнения ...
Использует ли gcc инструкции Intel SSE 4.2 для обработки текста, если таковые имеются?
Я читаюВот [http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=5762731&url=http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5762731] что Intel представилаSSE 4.2 instructions для ускорения обработки строк. Цитата из статьи: Набор ...
Взаимодействие SIMD (SSE / AVX) с GCC
Мне удалось преобразовать большую часть моего кода SIMD в векторные расширения GCC. Однако я не нашел хорошего решения для трансляции следующим образом
Авто векторизация не работает
Я пытаюсь заставить мой код автоматически векторизовать, но он не работает.
Есть ли более эффективный способ транслировать 4 смежных дубли в 4 регистра YMM?
В фрагменте кода C ++, который выполняет что-то похожее (но не совсем) умножение матриц, я загружаю 4 смежных двойных числа в 4 регистра YMM следующим образом: