Результаты поиска по запросу "neon"

5 ответов

Совместимость типов данных с внутренними компонентами NEON

Я работаю над оптимизацией ARM с использованием встроенных функций NEON из кода C ++. Я понимаю и справляюсь с большинством проблем печати, но я застрял в этом: Инструкцияvzip_u8 возвращаетuint8x8x2_t значение (на самом деле массив ...

4 ответа

Самый быстрый способ проверить 128-битный регистр NEON на значение 0 с помощью встроенных функций?

Я ищу самый быстрый способ проверить, содержит ли регистр 128 NEON все нули, используя встроенные NEON. В настоящее время я использую 3 операции OR и 2 MOV: uint32x4_t vr = vorrq_u32(vcmp0, vcmp1); uint64x2_t v0 = vreinterpretq_u64_u32(vr); ...

2 ответа

Самый быстрый обратный квадратный корень на iPhone

Я работаю над приложением для iPhone, которое включает определенные физические вычисления, которые выполняются тысячи раз в секунду. Я работаю над оптимизацией кода для улучшения частоты кадров. Одна из частей, которую я смотрю на улучшение, - ...

ТОП публикаций

1 ответ

Как помешать GCC взломать мою природу NEON?

Мне нужно написать оптимизированный код NEON для проекта, и я совершенно счастлив написать ассемблер, но для переносимости / удобства обслуживания я использу...

1 ответ

SIMD оптимизация cvtColor с использованием встроенных функций ARM NEON

1 ответ

 с {1, 2, 4, 8} и последующим

я есть результат сравнения двух операндов с плавающей запятой следующим образом; Что мне нужно сделать, так это на основе результата сравнения нужно выполнить следующее: т.е. neon_gt_res = vcgtq_f32(temp1, temp2); if(neon_gt_res[0]) array[0] |= ...

3 ответа

Методы векторизации гистограммы в SIMD?

Я пытаюсь реализовать гистограмму в Неоне. Можно ли векторизовать?

1 ответ

Неизвестное имя регистра «q0» в asm (arm64)

В настоящее время я пытаюсь скомпилировать мою библиотеку для новой арки arm64. У меня есть куча сборок NEON и для всех них я получаю ошибку Неизвестное имя регистра "q0" в asm. Даже если я напишу что-нибудь простое, как это: asm ( "" : : : ...

1 ответ

@Darkmax: вы должны загружать справочные руководства по архитектуре из ARM, а не полагаться на документацию заголовка NEON.

абатываю изображение на четыре пикселя за раз, это наarmv7 для приложения Android. Я хочу разделитьfloat32x4_t вектор другим вектором, но числа в нем отличаются от примерно0.7 в3.85и мне кажется, что единственный способ разделить ...

1 ответ

Как оптимизировать статистику гистограммы с помощью неоновых присадок?

Я хочу оптимизировать статистический код гистограммы с помощью неоновых встроенных функций. Но мне это не удалось. Вот код c: