Результаты поиска по запросу "sse"

1 ответ

Почему этот код SSE в 6 раз медленнее без VZEROUPPER на Skylake?

Я пытался выяснить проблему с производительностью в приложении и, наконец, сузил ее до действительно странной проблемы. Следующий фрагмент кода работает в 6 ...

0 ответов

Как эффективно выполнять двойные / int64 преобразования с SSE / AVX?

В SSE2 есть инструкции для преобразования векторов между числами с плавающей точкой одинарной точности и 32-разрядными целыми числами.

1 ответ

llatency vs пропускная способность в Intel Intrinsics

Мне кажется, я в целом хорошо понимаю разницу между задержкой и пропускной способностью. Однако влияние задержки на пропускную способность инструкций мне неясно для Intel Intrinsics, особенно при использовании нескольких внутренних вызовов ...

ТОП публикаций

1 ответ

Руководство по Intel Intrinsics - задержка и пропускная способность

Может ли кто-нибудь объяснить значения задержки и пропускной способности, приведенные вIntel Intrinsic Guide?Правильно ли я понял, что задержка - это количес...

1 ответ

Выравнивание и странное поведение SSE

Я пытаюсь работать с SSE, и я столкнулся с некоторым странным поведением.Я пишу простой код для сравнения двух строк с SSE Intrinsics, запускаю его, и он раб...

1 ответ

Более быстрая целочисленная незанятая загрузка SSE, которая редко используется [дубликат]

1 ответ

Сдвиг 4 целых числа вправо на разные значения SIMD

2 ответа

Какая минимальная версия OS X для использования с AVX / AVX2?

1 ответ

AVX2, Как эффективно загрузить четыре целых числа в четные индексы 256-битного регистра и копировать в нечетные индексы?

1 ответ

Новый синтаксис AVX-инструкций