Результаты поиска по запросу "neon"

1 ответ

Неизвестное имя регистра «q0» в asm (arm64)

В настоящее время я пытаюсь скомпилировать мою библиотеку для новой арки arm64. У меня есть куча сборок NEON и для всех них я получаю ошибку Неизвестное имя регистра "q0" в asm. Даже если я напишу что-нибудь простое, как это: asm ( "" : : : ...

2 ответа

Быстрый синус / косинус для ARMv7 + NEON: ищем тестеров…

Может кто-нибудь с доступом к iPhone 3GS или Pandora, пожалуйста, протестируйте следующую процедуру сборки, которую я только что написал?Предполагается, что ...

2 ответа

Самый быстрый обратный квадратный корень на iPhone

ТОП публикаций

2 ответа

Общие методы SIMD

Где я могу найти информацию о распространенных трюках SIMD? У меня есть набор инструкций, и я знаю, как написать не хитрый SIMD-код, но я знаю, что SIMD тепе...

2 ответа

Перевод SSE в Neon: как упаковать и извлечь 32-битный результат

Я должен перевести следующие инструкции из SSE в Neon

2 ответа

НКУ; arm64; aarch64; нераспознанный параметр командной строки '-mfpu = neon'

Я получил ошибку компиляции:нераспознанный параметр командной строки '-mfpu = neon' *когда пытался скомпилировать с -mfpu = неоновым флагом. На самом...

2 ответа

неоновые операции сравнения производят отрицательный результат

Я пытаюсь следующий код сборки:

2 ответа

NEON векторизовать сумму произведений байтов без знака: (a [i] -int1) * (b [i] -int2)

Мне нужно улучшить цикл, потому что он вызывается моим приложением тысячи раз. Я полагаю, мне нужно сделать это с Неоном, но я не знаю, с чего начать. Допущения / предварительные условия: w всегда 320 (кратно 16/32).pa а такжеpb выровнены по 16 ...

2 ответа

Быстрый синус / косинус для ARMv7 + NEON: ищем тестеров…

Может кто-нибудь с доступом к iPhone 3GS или Pandora, пожалуйста, протестируйте следующую процедуру сборки, которую я только что написал? Предполагается, что синусы и косинусы действительно очень быстро вычисляются на векторном FPU NEON. Я знаю, ...

2 ответа

Самый быстрый обратный квадратный корень на iPhone

Я работаю над приложением для iPhone, которое включает определенные физические вычисления, которые выполняются тысячи раз в секунду. Я работаю над оптимизацией кода для улучшения частоты кадров. Одна из частей, которую я смотрю на улучшение, - ...