Результаты поиска по запросу "sse"
Более быстрое умножение кватернионных векторов не работает
Мне нужна более быстрая процедура умножения кватернионных векторов для моей математической библиотеки. Щас использую канонический
Авто векторизация не работает
Я пытаюсь заставить мой код автоматически векторизовать, но он не работает.
сумма перекрывающихся массивов, авто-векторизация и ограничение
У Арстечни недавно была статьяПочему некоторые языки программирования быстрее других, Он сравнивает Fortran и C и упоминает массивы суммирования. В Фортране ...
Отключить функции AVX2 на процессорах, отличных от Haswell
Я написал код AVX2 для запуска на процессоре Haswell i7. Та же самая кодовая база также используется на процессорах не-Haswell, где тот же код должен быть за...
Как эта функция вычисляет абсолютное значение с плавающей запятой через операции NOT и AND?
Я пытаюсь понять, как работает следующий фрагмент кода. Эта программа использует векторные инструкции SIMD (Intel SSE) для вычисления абсолютного значения 4-...
Не могу получить более 50% макс. теоретическая производительность по матрице умножения
проблемаЯ изучаю HPC и оптимизацию кода. Я пытаюсь воспроизвести результаты в документе умножения семенной матрицы Гото (http://www.cs.utexas.edu/users/pinga...
SSE, ряд основных против основных проблем производительности столбца
Для личного и забавного я пишу geom lib, используя SSE (4.1).Последние 12 часов я провожу, пытаясь понять проблему с производительностью при работе с основно...