Результаты поиска по запросу "sse"

2 ответа

Почему мое прямое умножение кватернионов быстрее, чем SSE?

1 ответ

Более быстрое умножение кватернионных векторов не работает

Мне нужна более быстрая процедура умножения кватернионных векторов для моей математической библиотеки. Щас использую канонический

1 ответ

Влияет ли модификатор Java strictfp на современные процессоры?

Я знаю значение

ТОП публикаций

2 ответа

Авто векторизация не работает

Я пытаюсь заставить мой код автоматически векторизовать, но он не работает.

3 ответа

Инициализация типа __m128 из 64-разрядного целого без знака

3 ответа

сумма перекрывающихся массивов, авто-векторизация и ограничение

У Арстечни недавно была статьяПочему некоторые языки программирования быстрее других, Он сравнивает Fortran и C и упоминает массивы суммирования. В Фортране ...

2 ответа

Отключить функции AVX2 на процессорах, отличных от Haswell

Я написал код AVX2 для запуска на процессоре Haswell i7. Та же самая кодовая база также используется на процессорах не-Haswell, где тот же код должен быть за...

1 ответ

Как эта функция вычисляет абсолютное значение с плавающей запятой через операции NOT и AND?

Я пытаюсь понять, как работает следующий фрагмент кода. Эта программа использует векторные инструкции SIMD (Intel SSE) для вычисления абсолютного значения 4-...

1 ответ

Не могу получить более 50% макс. теоретическая производительность по матрице умножения

проблемаЯ изучаю HPC и оптимизацию кода. Я пытаюсь воспроизвести результаты в документе умножения семенной матрицы Гото (http://www.cs.utexas.edu/users/pinga...

2 ответа

SSE, ряд основных против основных проблем производительности столбца

Для личного и забавного я пишу geom lib, используя SSE (4.1).Последние 12 часов я провожу, пытаясь понять проблему с производительностью при работе с основно...