Resultados da pesquisa a pedido "neon"

4 a resposta

Erro desconhecido do GCC ao compilar para ARM NEON (Crítico)

Eu tenho um alvo de processador baseado em ARM NEON Cortex-A8. Eu estava otimizando meu código usando o NEON. Mas quando compilo meu código, recebo esse erro estranho. Não sei como consertar isso. Estou tentando compilar o seguinte código (PARTE ...

5 a resposta

Otimizando a conversão de RGBA8888 para RGB565 com NEON

Estou tentando otimizar uma conversão de formato de imagem no iOS usando o conjunto de instruções do vetor NEON. Presumi que isso fosse bem mapeado porque processa um monte de dados semelhante orém, minhas tentativas não foram tão boas, ...

2 a resposta

braço neon comparar operações gerar um negativo

Estou tentando o seguinte código de montagem: vclt.f32 q9,q0,#0 vst1.i32 q9,[r2:128]Mas se a condição for verdadeira, o elemento correspondente em q9 é definido como negativo em vez de positivo. O que posso fazer para obter um resultado positivo?

1 a resposta

Detectar a disponibilidade do ARM NEON no pré-processador?

De acordo comBRAÇO BRAÇO [http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0491c/BABJFEFG.html] , __ARM_NEON__ é definido quando as instruções Neon SIMD estão disponíveis. Estou tendo problemas para fazer com que o GCC ...

1 a resposta

Otimização SIMD do cvtColor usando intrínsecas ARM NEON

Estou trabalhando em uma otimização SIMD da conversão de BGR para escala de cinza que é equivalente aOpenCV'scvtColor() função [http://docs.opencv.org/2.4/modules/imgproc/doc/miscellaneous_transformations.html] . Existe uma versão Intel SSE dessa ...

3 a resposta

RGBA para ABGR: braço em linha de néon asm para iOS / Xcode

Este código (código muito semelhante, não tenteiexatament este código) é compilado usando o Android NDK, mas não com o Xcode / armv7 + arm64 / iOS Espelhos nos comentários: uint32_t *src; uint32_t *dst; #ifdef __ARM_NEON __asm__ volatile( ...

1 a resposta

NEON, SSE e cargas intercaladas vs shuffles

Estou tentando entender o comentário feito por "Não existirei idonotexista" em Otimização SIMD do cvtColor usando intrínsecas ARM NEON [https://stackoverflow.com/q/24977272]: ... por que você não usa as intrísticas ARM NEON que mapeiam para a ...

1 a resposta

Divida pelo número de ponto flutuante usando NEON intrinsics

Estou processando uma imagem em quatro pixels por vez, esta em umarmv7 para um aplicativo Android. Quero dividir umfloat32x4_t vetor por outro vetor, mas os números estão variando de aproximadamente0.7 para3.85, e me parece que a única maneira ...

2 a resposta

Traduzindo SSE para Neon: Como compactar e extrair o resultado de 32 bits

Eu tenho que traduzir as seguintes instruções de SSE para Neon uint32_t a = _mm_cvtsi128_si32(_mm_shuffle_epi8(a,SHUFFLE_MASK) );Onde: static const __m128i SHUFFLE_MASK = _mm_setr_epi8(3, 7, 11, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, ...

2 a resposta

NEON vectorize a soma dos produtos de bytes não assinados: (a [i] -int1) * (b [i] -int2)

Preciso melhorar um loop, porque é chamado pelo meu aplicativo milhares de vezes. Acho que preciso fazer isso com o Neon, mas não sei por onde começar. Pressupostos / pré-condições: w é sempre 320 (múltiplo de 16/32pa epb são alinhados por 16 ...