Resultados da pesquisa a pedido "neon"

2 a resposta

Traduzindo SSE para Neon: Como compactar e extrair o resultado de 32 bits

Eu tenho que traduzir as seguintes instruções de SSE para Neon uint32_t a = _mm_cvtsi128_si32(_mm_shuffle_epi8(a,SHUFFLE_MASK) );Onde: static const __m128i SHUFFLE_MASK = _mm_setr_epi8(3, 7, 11, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, ...

3 a resposta

Usando uma união (encapsulada em uma estrutura) para ignorar conversões para tipos de dados neon

Fiz minha primeira abordagem com intrínsecas de vetorização com SSE, onde há basicamente apenas um tipo de dados__m128i. Ao mudar para Neon, achei os tipos de dados e os protótipos de funções muito mais específicos, por exemplo,uint8x16_t (um ...

2 a resposta

gcc; arm64; aarch64; opção de linha de comando não reconhecida '-mfpu = neon'

Eu recebi um erro de compilação: opção de linha de comando não reconhecida '-mfpu = neon' * quando tentou compilar com o sinalizador -mfpu = neon. Na verdade, todas as opções 'mfpu' que tentei falharam. No entanto, na documentação, esse ...

3 a resposta

Como usar a multiplicação e o acúmulo de intrínsecas no ARM Cortex-a8?

como usar os intrínsecos de acumulação múltipla fornecidos pelo GCC? float32x4_t vmlaq_f32 (float32x4_t , float32x4_t , float32x4_t);Alguém pode explicar quais são os três parâmetros que tenho que passar para esta função. Quero dizer os ...

1 a resposta

Como impedir o GCC de quebrar meus intrínsecos NEON?

Preciso escrever um código NEON otimizado para um projeto e estou perfeitamente feliz em escrever uma linguagem assembly, mas, para portabilidade / manutenção, estou usando os instrumentos NEON. Esse código precisa ser o mais rápido possível, por ...

5 a resposta

Carregar ubit8_t de 8 bits como uint32_t?

meu projeto de processamento de imagens funciona com imagens em escala de cinza. Eu tenho a plataforma do processador ARM Cortex-A8. Eu quero fazer uso do NEON. Tenho uma imagem em escala de cinza (considere o exemplo abaixo) e, no ...

1 a resposta

NEON, SSE e cargas intercaladas vs shuffles

Estou tentando entender o comentário feito por "Não existirei idonotexista" em Otimização SIMD do cvtColor usando intrínsecas ARM NEON [https://stackoverflow.com/q/24977272]: ... por que você não usa as intrísticas ARM NEON que mapeiam para a ...

1 a resposta

Detectar a disponibilidade do ARM NEON no pré-processador?

De acordo comBRAÇO BRAÇO [http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0491c/BABJFEFG.html] , __ARM_NEON__ é definido quando as instruções Neon SIMD estão disponíveis. Estou tendo problemas para fazer com que o GCC ...

3 a resposta

RGBA para ABGR: braço em linha de néon asm para iOS / Xcode

Este código (código muito semelhante, não tenteiexatament este código) é compilado usando o Android NDK, mas não com o Xcode / armv7 + arm64 / iOS Espelhos nos comentários: uint32_t *src; uint32_t *dst; #ifdef __ARM_NEON __asm__ volatile( ...

1 a resposta

onvenção de chamada @ARM para C, NEON se registra para salvar

Existe umsimilar post [https://stackoverflow.com/questions/261419/arm-to-c-calling-convention-registers-to-save] que abrange registros regulares. E os registros NEON. Tanto quanto me lembro, a metade superior ou inferior dos registros deve ser ...