Результаты поиска по запросу "sse"

5 ответов

SSE-copy, AVX-copy и std :: copy производительность

m попытался улучшить производительность операции копирования через SSE и AVX:

9 ответов

Использование SSE в C # это возможно?

5 ответов

SSE-copy, AVX-copy и std :: copy производительность

Я пытался улучшить производительность операции копирования через SSE и AVX: #include <immintrin.h> const int sz = 1024; float *mas = (float *)_mm_malloc(sz*sizeof(float), 16); float *tar = (float *)_mm_malloc(sz*sizeof(float), 16); float a=0; ...

ТОП публикаций

8 ответов

Как выровнены векторные данные?

Если я хочу обработать данные вstd::vector с SSE мне нужно 16 байтов. Как я могу этого достичь? Нужно ли мне писать свой собственный распределитель? Или распределитель по умолчанию уже выровнен по 16-байтовым границам?

8 ответов

Я думаю, что он ищет что-то большее, чем просто внутреннее (какая-то абстракция более высокого уровня, я полагаю), но не совсем понятно, что именно.

ибудь знает библиотеку с открытым исходным кодом C ++ x86 SIMD? Intel предоставляет именно то, что мне нужно, в их интегрированной библиотеке примитивов производительности, но я не могу использовать это из-за авторских прав ...

2 ответа

производительность SSE и AVX, когда ширина полосы памяти ограничена

В приведенном ниже коде я изменилdataLen» и получить другую эффективность.dataLen = 400 SSE время: 758000 долларов США AVX время: 483000 долларов США SSE&gt;...

3 ответа

SSE, внутренности и выравнивание

1 ответ

Написать x86 asm-функции переносимо (win / linux / osx), без build-зависят от yasm / nasm?

par2 имеет небольшую и довольно чистую кодовую базу C ++, которая, как мне кажется, прекрасно работает на GNU / Linux, OS X и Windows (с MSVC ++).Я хотел бы ...

5 ответов

Существуют ли беззнаковые эквиваленты инструкций x87 FILD и SSE CVTSI2SD?

3 ответа

транспонировать для 8 регистров 16-битных элементов на SSE2 / SSSE3

(Я новичок в SSE / asm, извиняюсь, если это очевидно или излишне)Есть ли лучший способ транспонировать 8 регистров SSE, содержащих 16-битные значения, чем вы...