Результаты поиска по запросу "simd"
Сжатие разреженного массива с использованием SIMD (AVX2)
У меня есть редкий массив
C ++ SSE реализация фильтра
Я пытался использовать SSE, чтобы сделать операцию 4 пикселей. У меня проблема с загрузкой данных изображения в __m128. Мои данные изображения представляют с...
Использование SIMD / AVX / SSE для обхода дерева
В настоящее время я исследую, возможно ли ускорить обход дерева Ван Эмде Боаса (или любого дерева). Учитывая один поисковый запрос в качестве входных данных,...
Общие методы SIMD
Где я могу найти информацию о распространенных трюках SIMD? У меня есть набор инструкций, и я знаю, как написать не хитрый SIMD-код, но я знаю, что SIMD тепе...
Взаимодействие SIMD (SSE / AVX) с GCC
Мне удалось преобразовать большую часть моего кода SIMD в векторные расширения GCC. Однако я не нашел хорошего решения для трансляции следующим образом
Авто векторизация не работает
Я пытаюсь заставить мой код автоматически векторизовать, но он не работает.
Есть ли более эффективный способ транслировать 4 смежных дубли в 4 регистра YMM?
В фрагменте кода C ++, который выполняет что-то похожее (но не совсем) умножение матриц, я загружаю 4 смежных двойных числа в 4 регистра YMM следующим образом:
упаковка 10-битных значений в поток байтов с SIMD
Я пытаюсь упаковать 10-битные пиксели в непрерывный поток байтов, используя инструкции SIMD. Код ниже делает это «в принципе», но версия SIMD медленнее, чем ...
Как эта функция вычисляет абсолютное значение с плавающей запятой через операции NOT и AND?
Я пытаюсь понять, как работает следующий фрагмент кода. Эта программа использует векторные инструкции SIMD (Intel SSE) для вычисления абсолютного значения 4-...