Результаты поиска по запросу "sse"
пользовательский расширенный векторный тип: например, float4 b = v.xxyz;
OpenCL, GCC и Clang имеют убедительный векторный типрасширения.Одна из функций, которые мне нравятся больше всего, - это возможность совершать извращение сле...
Общие методы SIMD
Где я могу найти информацию о распространенных трюках SIMD? У меня есть набор инструкций, и я знаю, как написать не хитрый SIMD-код, но я знаю, что SIMD тепе...
Как использовать инструкции Fused Multiply-Add (FMA) с SSE / AVX
Я узнал, что некоторые процессоры Intel / AMD могут выполнять одновременное умножение и добавление с помощью SSE / AVX: FLOPS за цикл для песчаного моста и скважины SSE2 / AVX / ...
Ускорение короткого броска?
У меня есть короткий бросок в C ++, который является узким местом в моем коде. Код транслируется из буфера аппаратного устройства, который изначально имеет короткое замыкание, он представляет собой вход от причудливого счетчика фотонов. float ...
Арифметика __int128_t эмулируется GCC, даже с SSE?
Я слышал, что 128-битные целочисленные типы данных, такие как__int128_t предоставляемые GCC эмулируются и поэтому работают медленно. Однако я понимаю, что в различных наборах инструкций SSE (SSE, SSE2, ..., AVX) были введены, по крайней мере, ...
SIMD и разница между упакованной и скалярной двойной точностью
Я читаю руководство по встроенным функциям Intel при реализации поддержки SIMD. У меня есть несколько путаницы, и мои вопросы, как показано ниже. __m128 _mm_cmpeq_ps (__m128 a, __m128 b) Документация говорит, что она используется для сравнения ...
Использует ли gcc инструкции Intel SSE 4.2 для обработки текста, если таковые имеются?
Я читаюВот [http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=5762731&url=http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5762731] что Intel представилаSSE 4.2 instructions для ускорения обработки строк. Цитата из статьи: Набор ...
Взаимодействие SIMD (SSE / AVX) с GCC
Мне удалось преобразовать большую часть моего кода SIMD в векторные расширения GCC. Однако я не нашел хорошего решения для трансляции следующим образом