Resultados da pesquisa a pedido "neon"
Erro desconhecido do GCC ao compilar para ARM NEON (Crítico)
Eu tenho um alvo de processador baseado em ARM NEON Cortex-A8. Eu estava otimizando meu código usando o NEON. Mas quando compilo meu código, recebo esse erro estranho. Não sei como consertar isso. Estou tentando compilar o seguinte código (PARTE ...
Otimizando a conversão de RGBA8888 para RGB565 com NEON
Estou tentando otimizar uma conversão de formato de imagem no iOS usando o conjunto de instruções do vetor NEON. Presumi que isso fosse bem mapeado porque processa um monte de dados semelhante orém, minhas tentativas não foram tão boas, ...
braço neon comparar operações gerar um negativo
Estou tentando o seguinte código de montagem: vclt.f32 q9,q0,#0 vst1.i32 q9,[r2:128]Mas se a condição for verdadeira, o elemento correspondente em q9 é definido como negativo em vez de positivo. O que posso fazer para obter um resultado positivo?
Detectar a disponibilidade do ARM NEON no pré-processador?
De acordo comBRAÇO BRAÇO [http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0491c/BABJFEFG.html] , __ARM_NEON__ é definido quando as instruções Neon SIMD estão disponíveis. Estou tendo problemas para fazer com que o GCC ...
Otimização SIMD do cvtColor usando intrínsecas ARM NEON
Estou trabalhando em uma otimização SIMD da conversão de BGR para escala de cinza que é equivalente aOpenCV'scvtColor() função [http://docs.opencv.org/2.4/modules/imgproc/doc/miscellaneous_transformations.html] . Existe uma versão Intel SSE dessa ...
RGBA para ABGR: braço em linha de néon asm para iOS / Xcode
Este código (código muito semelhante, não tenteiexatament este código) é compilado usando o Android NDK, mas não com o Xcode / armv7 + arm64 / iOS Espelhos nos comentários: uint32_t *src; uint32_t *dst; #ifdef __ARM_NEON __asm__ volatile( ...
NEON, SSE e cargas intercaladas vs shuffles
Estou tentando entender o comentário feito por "Não existirei idonotexista" em Otimização SIMD do cvtColor usando intrínsecas ARM NEON [https://stackoverflow.com/q/24977272]: ... por que você não usa as intrísticas ARM NEON que mapeiam para a ...
Divida pelo número de ponto flutuante usando NEON intrinsics
Estou processando uma imagem em quatro pixels por vez, esta em umarmv7 para um aplicativo Android. Quero dividir umfloat32x4_t vetor por outro vetor, mas os números estão variando de aproximadamente0.7 para3.85, e me parece que a única maneira ...
Traduzindo SSE para Neon: Como compactar e extrair o resultado de 32 bits
Eu tenho que traduzir as seguintes instruções de SSE para Neon uint32_t a = _mm_cvtsi128_si32(_mm_shuffle_epi8(a,SHUFFLE_MASK) );Onde: static const __m128i SHUFFLE_MASK = _mm_setr_epi8(3, 7, 11, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, ...
NEON vectorize a soma dos produtos de bytes não assinados: (a [i] -int1) * (b [i] -int2)
Preciso melhorar um loop, porque é chamado pelo meu aplicativo milhares de vezes. Acho que preciso fazer isso com o Neon, mas não sei por onde começar. Pressupostos / pré-condições: w é sempre 320 (múltiplo de 16/32pa epb são alinhados por 16 ...