Resultados de la búsqueda a petición "neon"

5 la respuesta

¿Por qué ARM NEON no es más rápido que C ++ simple?

Aquí hay un código C ++: #define ARR_SIZE_TEST ( 8 * 1024 * 1024 ) void cpp_tst_add( unsigned* x, unsigned* y ) { for ( register int i = 0; i < ARR_SIZE_TEST; ++i ) { x[ i ] = x[ i ] + y[ i ]; } } Aquí hay una versión de neón: void ...

1 la respuesta

Dividir por número de punto flotante usando NEON intrinsics

Estoy procesando una imagen de cuatro píxeles en ese momento, esto en unarmv7 para una aplicación de Android. Quiero dividir unfloat32x4_t vector por otro vector pero los números en él varían desde alrededor de0.7 a3.85, y me parece que la ...

3 la respuesta

ARM NEON ensamblador error: "la instrucción no puede ser condicional"

De acuerdo con la centro de información de armas [http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0489c/CIHJCAAG.html] vadd se puede ejecutar condicionalmente sin embargo cuando intento vaddeq.f32 d0,d0,d1Xcode ...

5 la respuesta

Optimizando la conversión de RGBA8888 a RGB565 con NEON

Estoy tratando de optimizar una conversión de formato de imagen en iOS usando el conjunto de instrucciones vectoriales NEON. Supuse que esto se correlacionaría bien con eso porque procesa un montón de datos similares. in embargo, mis intentos ...

4 la respuesta

NEON vectoriza la suma de productos de bytes sin signo: (a [i] -int1) * (b [i] -int2)

Necesito mejorar un ciclo, porque mi aplicación lo llama miles de veces. Supongo que necesito hacerlo con Neon, pero no sé por dónde empezar. Suposiciones / condiciones previas: w siempre es 320 (múltiplo de 16/32).pa ypb están alineados a 16 ...

8 la respuesta

Intrínsecos de neón del brazo vs ensamblaje manual

https: //web.archive.org/web/20170227190422/http: //hilbert-space.de/? p = 22 [https://web.archive.org/web/20170227190422/http://hilbert-space.de/?p=22] En este sitio, que está bastante anticuado, muestra que los manuscritos escritos a mano ...