Результаты поиска по запросу "neon"

7 ответов

Кодирование для ARM NEON: с чего начать?

ФОН (пропустите это, если хотите)Позвольте мне начать с того, что я не опытный программист. Я молодой младший инженер по компьютерному зрению (CV), и у меня ...

1 ответ

SIMD оптимизация cvtColor с использованием встроенных функций ARM NEON

2 ответа

Самый быстрый обратный квадратный корень на iPhone

Я работаю над приложением для iPhone, которое включает определенные физические вычисления, которые выполняются тысячи раз в секунду. Я работаю над оптимизацией кода для улучшения частоты кадров. Одна из частей, которую я смотрю на улучшение, - ...

ТОП публикаций

2 ответа

Самый быстрый обратный квадратный корень на iPhone

1 ответ

Неизвестное имя регистра «q0» в asm (arm64)

В настоящее время я пытаюсь скомпилировать мою библиотеку для новой арки arm64. У меня есть куча сборок NEON и для всех них я получаю ошибку Неизвестное имя регистра "q0" в asm. Даже если я напишу что-нибудь простое, как это: asm ( "" : : : ...

1 ответ

Неизвестное имя регистра «q0» в asm (arm64)

В настоящее время я пытаюсь скомпилировать мою библиотеку для новой арки arm64. У меня есть куча сборок NEON и для всех них я получаю ошибкуНеизвестный регис...

1 ответ

SIMD векторизация atan2 с использованием сборки ARM NEON

Я хочу рассчитать величину и угол 4 точки, используя неоновые инструкции SIMD и кронштейн в сборе. В большинстве языков есть встроенная библиотека, в моем случае C ++, которая вычисляет угол (atan2), но только для одной пары переменных с ...

1 ответ

SIMD векторизация atan2 с использованием сборки ARM NEON

4 ответа

Самый быстрый способ проверить 128-битный регистр NEON на значение 0 с помощью встроенных функций?

Я ищу самый быстрый способ проверить, содержит ли регистр 128 NEON все нули, используя встроенные NEON. В настоящее время я использую 3 операции OR и 2 MOV: uint32x4_t vr = vorrq_u32(vcmp0, vcmp1); uint64x2_t v0 = vreinterpretq_u64_u32(vr); ...

4 ответа

Самый быстрый способ проверить 128-битный регистр NEON на значение 0 с помощью встроенных функций?