Resultados da pesquisa a pedido "neon"

0 a resposta

Riscos de desempenho de dados de depuração / néon no código de néon do braço

Originalmente, o problema apareceu quando tenteiotimizar um algoritmo [https://stackoverflow.com/questions/49928749/efficiently-compute-max-of-an-array-of-8-elements-in-arm-neon] para o braço de neon e uma parte menor estava consumindo 80% de ...

1 a resposta

Vetor de pacote NEON compara resultado em bitmap

Eu tenho um resultado de comparação da comparação de dois operandos de ponto flutuante da seguinte maneira; O que eu preciso fazer é baseado no resultado da comparação e executar o seguinte: ou seja: neon_gt_res = vcgtq_f32(temp1, temp2); ...

1 a resposta

Como otimizar as estatísticas do histograma com intrínsecos a neon?

Eu quero otimizar o código estatístico do histograma com intrínsecos de neon. Mas não obtive sucesso. Aqui está o código c: #define NUM (7*1024*1024) uint8 src_data[NUM]; uint32 histogram_result[256] = {0}; for (int i = 0; i < NUM; i++) { ...

3 a resposta

RGBA para ABGR: braço em linha de néon asm para iOS / Xcode

Este código (código muito semelhante, não tenteiexatament este código) é compilado usando o Android NDK, mas não com o Xcode / armv7 + arm64 / iOS Espelhos nos comentários: uint32_t *src; uint32_t *dst; #ifdef __ARM_NEON __asm__ volatile( ...

2 a resposta

braço neon comparar operações gerar um negativo

Estou tentando o seguinte código de montagem: vclt.f32 q9,q0,#0 vst1.i32 q9,[r2:128]Mas se a condição for verdadeira, o elemento correspondente em q9 é definido como negativo em vez de positivo. O que posso fazer para obter um resultado positivo?

1 a resposta

NEON, SSE e cargas intercaladas vs shuffles

Estou tentando entender o comentário feito por "Não existirei idonotexista" em Otimização SIMD do cvtColor usando intrínsecas ARM NEON [https://stackoverflow.com/q/24977272]: ... por que você não usa as intrísticas ARM NEON que mapeiam para a ...

1 a resposta

Detectar a disponibilidade do ARM NEON no pré-processador?

De acordo comBRAÇO BRAÇO [http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0491c/BABJFEFG.html] , __ARM_NEON__ é definido quando as instruções Neon SIMD estão disponíveis. Estou tendo problemas para fazer com que o GCC ...

1 a resposta

Como impedir o GCC de quebrar meus intrínsecos NEON?

Preciso escrever um código NEON otimizado para um projeto e estou perfeitamente feliz em escrever uma linguagem assembly, mas, para portabilidade / manutenção, estou usando os instrumentos NEON. Esse código precisa ser o mais rápido possível, por ...

2 a resposta

gcc; arm64; aarch64; opção de linha de comando não reconhecida '-mfpu = neon'

Eu recebi um erro de compilação: opção de linha de comando não reconhecida '-mfpu = neon' * quando tentou compilar com o sinalizador -mfpu = neon. Na verdade, todas as opções 'mfpu' que tentei falharam. No entanto, na documentação, esse ...

3 a resposta

Usando uma união (encapsulada em uma estrutura) para ignorar conversões para tipos de dados neon

Fiz minha primeira abordagem com intrínsecas de vetorização com SSE, onde há basicamente apenas um tipo de dados__m128i. Ao mudar para Neon, achei os tipos de dados e os protótipos de funções muito mais específicos, por exemplo,uint8x16_t (um ...