Resultados da pesquisa a pedido "neon"
Traduzindo SSE para Neon: Como compactar e extrair o resultado de 32 bits
Eu tenho que traduzir as seguintes instruções de SSE para Neon uint32_t a = _mm_cvtsi128_si32(_mm_shuffle_epi8(a,SHUFFLE_MASK) );Onde: static const __m128i SHUFFLE_MASK = _mm_setr_epi8(3, 7, 11, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, ...
Usando uma união (encapsulada em uma estrutura) para ignorar conversões para tipos de dados neon
Fiz minha primeira abordagem com intrínsecas de vetorização com SSE, onde há basicamente apenas um tipo de dados__m128i. Ao mudar para Neon, achei os tipos de dados e os protótipos de funções muito mais específicos, por exemplo,uint8x16_t (um ...
gcc; arm64; aarch64; opção de linha de comando não reconhecida '-mfpu = neon'
Eu recebi um erro de compilação: opção de linha de comando não reconhecida '-mfpu = neon' * quando tentou compilar com o sinalizador -mfpu = neon. Na verdade, todas as opções 'mfpu' que tentei falharam. No entanto, na documentação, esse ...
Como usar a multiplicação e o acúmulo de intrínsecas no ARM Cortex-a8?
como usar os intrínsecos de acumulação múltipla fornecidos pelo GCC? float32x4_t vmlaq_f32 (float32x4_t , float32x4_t , float32x4_t);Alguém pode explicar quais são os três parâmetros que tenho que passar para esta função. Quero dizer os ...
Como impedir o GCC de quebrar meus intrínsecos NEON?
Preciso escrever um código NEON otimizado para um projeto e estou perfeitamente feliz em escrever uma linguagem assembly, mas, para portabilidade / manutenção, estou usando os instrumentos NEON. Esse código precisa ser o mais rápido possível, por ...
Carregar ubit8_t de 8 bits como uint32_t?
meu projeto de processamento de imagens funciona com imagens em escala de cinza. Eu tenho a plataforma do processador ARM Cortex-A8. Eu quero fazer uso do NEON. Tenho uma imagem em escala de cinza (considere o exemplo abaixo) e, no ...
NEON, SSE e cargas intercaladas vs shuffles
Estou tentando entender o comentário feito por "Não existirei idonotexista" em Otimização SIMD do cvtColor usando intrínsecas ARM NEON [https://stackoverflow.com/q/24977272]: ... por que você não usa as intrísticas ARM NEON que mapeiam para a ...
Detectar a disponibilidade do ARM NEON no pré-processador?
De acordo comBRAÇO BRAÇO [http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0491c/BABJFEFG.html] , __ARM_NEON__ é definido quando as instruções Neon SIMD estão disponíveis. Estou tendo problemas para fazer com que o GCC ...
RGBA para ABGR: braço em linha de néon asm para iOS / Xcode
Este código (código muito semelhante, não tenteiexatament este código) é compilado usando o Android NDK, mas não com o Xcode / armv7 + arm64 / iOS Espelhos nos comentários: uint32_t *src; uint32_t *dst; #ifdef __ARM_NEON __asm__ volatile( ...
onvenção de chamada @ARM para C, NEON se registra para salvar
Existe umsimilar post [https://stackoverflow.com/questions/261419/arm-to-c-calling-convention-registers-to-save] que abrange registros regulares. E os registros NEON. Tanto quanto me lembro, a metade superior ou inferior dos registros deve ser ...