Resultados da pesquisa a pedido "neon"
Riscos de desempenho de dados de depuração / néon no código de néon do braço
Originalmente, o problema apareceu quando tenteiotimizar um algoritmo [https://stackoverflow.com/questions/49928749/efficiently-compute-max-of-an-array-of-8-elements-in-arm-neon] para o braço de neon e uma parte menor estava consumindo 80% de ...
Vetor de pacote NEON compara resultado em bitmap
Eu tenho um resultado de comparação da comparação de dois operandos de ponto flutuante da seguinte maneira; O que eu preciso fazer é baseado no resultado da comparação e executar o seguinte: ou seja: neon_gt_res = vcgtq_f32(temp1, temp2); ...
Como otimizar as estatísticas do histograma com intrínsecos a neon?
Eu quero otimizar o código estatístico do histograma com intrínsecos de neon. Mas não obtive sucesso. Aqui está o código c: #define NUM (7*1024*1024) uint8 src_data[NUM]; uint32 histogram_result[256] = {0}; for (int i = 0; i < NUM; i++) { ...
RGBA para ABGR: braço em linha de néon asm para iOS / Xcode
Este código (código muito semelhante, não tenteiexatament este código) é compilado usando o Android NDK, mas não com o Xcode / armv7 + arm64 / iOS Espelhos nos comentários: uint32_t *src; uint32_t *dst; #ifdef __ARM_NEON __asm__ volatile( ...
braço neon comparar operações gerar um negativo
Estou tentando o seguinte código de montagem: vclt.f32 q9,q0,#0 vst1.i32 q9,[r2:128]Mas se a condição for verdadeira, o elemento correspondente em q9 é definido como negativo em vez de positivo. O que posso fazer para obter um resultado positivo?
NEON, SSE e cargas intercaladas vs shuffles
Estou tentando entender o comentário feito por "Não existirei idonotexista" em Otimização SIMD do cvtColor usando intrínsecas ARM NEON [https://stackoverflow.com/q/24977272]: ... por que você não usa as intrísticas ARM NEON que mapeiam para a ...
Detectar a disponibilidade do ARM NEON no pré-processador?
De acordo comBRAÇO BRAÇO [http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0491c/BABJFEFG.html] , __ARM_NEON__ é definido quando as instruções Neon SIMD estão disponíveis. Estou tendo problemas para fazer com que o GCC ...
Como impedir o GCC de quebrar meus intrínsecos NEON?
Preciso escrever um código NEON otimizado para um projeto e estou perfeitamente feliz em escrever uma linguagem assembly, mas, para portabilidade / manutenção, estou usando os instrumentos NEON. Esse código precisa ser o mais rápido possível, por ...
gcc; arm64; aarch64; opção de linha de comando não reconhecida '-mfpu = neon'
Eu recebi um erro de compilação: opção de linha de comando não reconhecida '-mfpu = neon' * quando tentou compilar com o sinalizador -mfpu = neon. Na verdade, todas as opções 'mfpu' que tentei falharam. No entanto, na documentação, esse ...
Usando uma união (encapsulada em uma estrutura) para ignorar conversões para tipos de dados neon
Fiz minha primeira abordagem com intrínsecas de vetorização com SSE, onde há basicamente apenas um tipo de dados__m128i. Ao mudar para Neon, achei os tipos de dados e os protótipos de funções muito mais específicos, por exemplo,uint8x16_t (um ...