Resultados de la búsqueda a petición "neon"
¿Existe una buena referencia para los intrínsecos ARM Neon?
El manual de referencia ARM no entra en demasiados detalles en las instrucciones individuales ...
Codificación para ARM NEON: ¿Cómo comenzar?
ANTECEDENTES (omita esto si lo desea) Permítanme comenzar diciendo que no soy un programador experto. Soy un joven ingeniero junior de visión por computadora (CV) y tengo bastante experiencia en programación en C ++, principalmente debido al uso ...
Traducción de SSE a Neon: cómo empacar y luego extraer el resultado de 32 bits
Tengo que traducir las siguientes instrucciones de SSE a Neon uint32_t a = _mm_cvtsi128_si32(_mm_shuffle_epi8(a,SHUFFLE_MASK) );Dónde: static const __m128i SHUFFLE_MASK = _mm_setr_epi8(3, 7, 11, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, ...
Usar una unión (encapsulada en una estructura) para evitar conversiones para tipos de datos de neón
Hice mi primer acercamiento con intrínsecos de vectorización con SSE, donde básicamente solo hay un tipo de datos__m128i. Al cambiar a Neon, descubrí que los tipos de datos y los prototipos de funciones son mucho más específicos, p.uint8x16_t (un ...
gcc; arm64; aarch64; opción de línea de comando no reconocida '-mfpu = neon'
Tengo un error de compilación: opción de línea de comando no reconocida '-mfpu = neon' * cuando trató de compilar con -mfpu = bandera de neón. En realidad, cualquier opción 'mfpu' que probé falló. Sin embargo, en la documentación se menciona ...
¿Cómo utilizar la multiplicación y acumulación de intrínsecos en ARM Cortex-a8?
¿Cómo utilizar los intrínsecos de acumulación múltiple multiplicados por GCC? float32x4_t vmlaq_f32 (float32x4_t , float32x4_t , float32x4_t);¿Alguien puede explicar qué tres parámetros tengo que pasar a esta función? Me refiero a los registros ...
Datos de depuración / riesgos de rendimiento de neón en el código de neón del brazo
Originalmente el problema apareció cuando intentéoptimizar un algoritmo [https://stackoverflow.com/questions/49928749/efficiently-compute-max-of-an-array-of-8-elements-in-arm-neon] para el brazo de neón y una pequeña parte de él tomaba el 80% de ...
¿Cómo evitar que GCC rompa mis intrínsecos NEON?
Necesito escribir código NEON optimizado para un proyecto y estoy perfectamente feliz de escribir lenguaje ensamblador, pero para portabilidad / mantenibilidad estoy usando NEON instrinsics. Este código debe ser lo más rápido posible, por lo que ...
RGBA a ABGR: Inline arm neon asm para iOS / Xcode
Este código (código muy similar, no he probadoexactament este código) compila usando Android NDK, pero no con Xcode / armv7 + arm64 / iOS Errores en los comentarios: uint32_t *src; uint32_t *dst; #ifdef __ARM_NEON __asm__ volatile( "vld1.32 ...
onvención de llamada de @ARM a C, NEON se registra para guardar
Hay unsimilar post [https://stackoverflow.com/questions/261419/arm-to-c-calling-convention-registers-to-save] que cubre registros regulares. ¿Qué pasa con los registros NEON? Hasta donde recuerdo, la mitad superior o la mitad inferior de los ...