Результаты поиска по запросу "sse"

0 ответов

Как реализовать atoi с помощью SIMD?

Я хотел бы попытаться написать реализацию atoi с использованием инструкций SIMD, которая будет включена вRapidJSON (библиотека для чтения / записи C ++ JSON)...

2 ответа

Индексы ненулевых байтов регистра SSE / AVX

1 ответ

Инструкция SSE MOVSD (расширенная: скалярные и векторные операции с плавающей точкой на x86, x86-64)

Меня как-то смущает инструкция по сборке MOVSD. Я написал некоторый числовой код, вычисляющий некоторое умножение матриц, просто используя обычный код C без ...

ТОП публикаций

1 ответ

Самый эффективный способ получить __m256 горизонтальных сумм из 8 исходных __m256 векторов

Я знаю как подвести итог

1 ответ

Где Кланг '_mm256_pow_ps' свойственный?

Кажется, я не могу найти встроенные функции для _mm_pow_ps или _mm256_pow_ps, оба из которых должны быть включены в immintrin.h.Clang не определяет их или он...

5 ответов

SSE-copy, AVX-copy и std :: copy производительность

Я пытался улучшить производительность операции копирования через SSE и AVX: #include <immintrin.h> const int sz = 1024; float *mas = (float *)_mm_malloc(sz*sizeof(float), 16); float *tar = (float *)_mm_malloc(sz*sizeof(float), 16); float a=0; ...

1 ответ

NEON, SSE и чередование нагрузок и тасовок

Я пытаюсь понять комментарий, сделанный &quot;Iwillnotexist Idonotexist&quot; вSIMD оптимизация cvtColor с использованием встроенных функций ARM NEON:... поч...

3 ответа

Что означает «не временный» доступ к памяти в x86

Это вопрос несколько низкого уровня. В сборке x86 есть две инструкции SSE:

1 ответ

Где VPERMB в AVX2?

1 ответ

AVX2, Как эффективно загрузить четыре целых числа в четные индексы 256-битного регистра и копировать в нечетные индексы?