Результаты поиска по запросу "neon"

0 ответов

s NEON> ARM. Я проверю это.

начально проблема появилась, когда я пыталсяоптимизировать алгоритм [https://stackoverflow.com/questions/49928749/efficiently-compute-max-of-an-array-of-8-elements-in-arm-neon] для неоновой руки и какой-то незначительной ее части, по данным ...

1 ответ

stackoverflow.com/a/29603040/224671

твуетаналогичный пост [https://stackoverflow.com/questions/261419/arm-to-c-calling-convention-registers-to-save] это охватывает регулярные регистры. Как насчет НЕОН регистров. Насколько я помню, либо верхняя, либо нижняя половина регистров должны ...

5 ответов

200% реалистично для некоторых рабочих нагрузок. Примерами являются просто патологические случаи: плохое разделение нагрузки и использование 100% кеша.

од C ++: #define ARR_SIZE_TEST ( 8 * 1024 * 1024 ) void cpp_tst_add( unsigned* x, unsigned* y ) { for ( register int i = 0; i < ARR_SIZE_TEST; ++i ) { x[ i ] = x[ i ] + y[ i ]; } }Вот неоновая версия: void neon_assm_tst_add( unsigned* x, ...

ТОП публикаций

1 ответ

@Darkmax: вы должны загружать справочные руководства по архитектуре из ARM, а не полагаться на документацию заголовка NEON.

абатываю изображение на четыре пикселя за раз, это наarmv7 для приложения Android. Я хочу разделитьfloat32x4_t вектор другим вектором, но числа в нем отличаются от примерно0.7 в3.85и мне кажется, что единственный способ разделить ...

3 ответа

суа.

сноинформационный центр вооружения [http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0489c/CIHJCAAG.html] VADD может быть выполнен условно, однако, когда я пытаюсь vaddeq.f32 d0,d0,d1Xcode возвращается 65:instruction cannot be ...

1 ответ

Неизвестное имя регистра «q0» в asm (arm64)

В настоящее время я пытаюсь скомпилировать мою библиотеку для новой арки arm64. У меня есть куча сборок NEON и для всех них я получаю ошибку Неизвестное имя регистра "q0" в asm. Даже если я напишу что-нибудь простое, как это: asm ( "" : : : ...

5 ответов

Оптимизация преобразования RGBA8888 в RGB565 с помощью NEON

Я пытаюсь оптимизировать преобразование формата изображения на iOS с помощью набора векторных инструкций NEON. Я предположил, что это будет соответствовать этому, потому что он обрабатывает кучу похожих данных. Однако мои попытки не увенчались ...

2 ответа

NEON векторизовать сумму произведений байтов без знака: (a [i] -int1) * (b [i] -int2)

Мне нужно улучшить цикл, потому что он вызывается моим приложением тысячи раз. Я полагаю, мне нужно сделать это с Неоном, но я не знаю, с чего начать. Допущения / предварительные условия: w всегда 320 (кратно 16/32).pa а такжеpb выровнены по 16 ...

2 ответа

Общие методы SIMD

Где я могу найти информацию о распространенных трюках SIMD? У меня есть набор инструкций, и я знаю, как написать не хитрый SIMD-код, но я знаю, что SIMD теперь намного мощнее. Может содержать сложный условный код без ответвлений. Например ...

2 ответа

Самый быстрый обратный квадратный корень на iPhone

Я работаю над приложением для iPhone, которое включает определенные физические вычисления, которые выполняются тысячи раз в секунду. Я работаю над оптимизацией кода для улучшения частоты кадров. Одна из частей, которую я смотрю на улучшение, - ...