Результаты поиска по запросу "sse"
SSE-copy, AVX-copy и std :: copy производительность
m попытался улучшить производительность операции копирования через SSE и AVX:
SSE-copy, AVX-copy и std :: copy производительность
Я пытался улучшить производительность операции копирования через SSE и AVX: #include <immintrin.h> const int sz = 1024; float *mas = (float *)_mm_malloc(sz*sizeof(float), 16); float *tar = (float *)_mm_malloc(sz*sizeof(float), 16); float a=0; ...
Как выровнены векторные данные?
Если я хочу обработать данные вstd::vector с SSE мне нужно 16 байтов. Как я могу этого достичь? Нужно ли мне писать свой собственный распределитель? Или распределитель по умолчанию уже выровнен по 16-байтовым границам?
Я думаю, что он ищет что-то большее, чем просто внутреннее (какая-то абстракция более высокого уровня, я полагаю), но не совсем понятно, что именно.
ибудь знает библиотеку с открытым исходным кодом C ++ x86 SIMD? Intel предоставляет именно то, что мне нужно, в их интегрированной библиотеке примитивов производительности, но я не могу использовать это из-за авторских прав ...
производительность SSE и AVX, когда ширина полосы памяти ограничена
В приведенном ниже коде я изменилdataLen» и получить другую эффективность.dataLen = 400 SSE время: 758000 долларов США AVX время: 483000 долларов США SSE>...
Написать x86 asm-функции переносимо (win / linux / osx), без build-зависят от yasm / nasm?
par2 имеет небольшую и довольно чистую кодовую базу C ++, которая, как мне кажется, прекрасно работает на GNU / Linux, OS X и Windows (с MSVC ++).Я хотел бы ...