Resultados da pesquisa a pedido "simd"

5 a resposta

SSE2: Função de log de precisão dupla

Preciso de implementação de código aberto (sem restrição de licença) da função de log, algo com assinatura __m128d _mm_log_pd(__m128d);Está disponível na Intel Short Vector Math Library (parte do ICC), mas o ICC não é gratuito nem de código ...

2 a resposta

Qual é a maneira mais eficiente de carregar e extrair valores inteiros de 32 bits de um vetor SSE de 128 bits?

Estou tentando otimizar meu código usando intrínsecas SSE, mas estou com um problema em que não conheço uma boa maneira de extrair os valores inteiros de um vetor depois de executar as operações intrínsecas SSE para obter o que quero. Alguém ...

1 a resposta

Qual é a penalidade de misturar os esquemas codificados em EVEX e VEX?

É umproblema conhecido [https://stackoverflow.com/questions/41303780/why-is-this-sse-code-6-times-slower-without-vzeroupper-on-skylake] que misturar instruções codificadas em VEX e não-VEX tem uma penalidade e o programador deve estar ciente ...

1 a resposta

bits de registro avx2 reversos

Existe uma maneira (rápida) de executar bits reversos dos valores int de 32 bits no registro avx2? Por exemplo. _mm256_set1_epi32(2732370386); <do something here> //binary: 10100010110111001010100111010010 => 1001011100101010011101101000101 ...

2 a resposta

Erro: transmitir tipos de dados definidos pelo usuário em c

Esta é uma visão mais simples do meu Problema. Quero converter um valor flutuante no tipo definido v4si (desejo usar a Operação SIMD para otimização.) Por favor, ajude a converter o valor flutuante / duplo em um tipo definido. #include<stdio.h> ...

3 a resposta

Implementação mais rápida da função exponencial usando o AVX

Estou procurando uma aproximação eficiente (rápida) da função exponencial que opera em elementos AVX (ponto flutuante de precisão única). Ou seja -__m256 _mm256_exp_ps( __m256 x ) sem SVML. Precisão relativa deve ser algo como ~ 1e-6 ou ~ 20 ...

8 a resposta

Estrutura c ++ SSE SIMD [fechada]

Alguém conhece uma biblioteca intrínseca de código aberto C ++ x86 SIMD? A Intel fornece exatamente o que eu preciso em sua biblioteca de primitivas de desempenho integrada, mas não posso usá-lo por causa dos direitos autorais em todo o ...

2 a resposta

Técnicas SIMD comuns

Onde posso encontrar informações sobre truques comuns do SIMD? Eu tenho um conjunto de instruções e sei como escrever código SIMD não complicado, mas sei que agora o SIMD é muito mais poderoso. Ele pode conter código sem ramificação condicional ...

2 a resposta

transmissões SIMD implícitas (SSE / AVX) com o GCC

Consegui converter a maior parte do meu código SIMD para as extensões de vetor do GCC. No entanto, não encontrei uma boa solução para fazer uma transmissão da seguinte maneira __m256 areg0 = _mm256_broadcast_ss(&a[i]);eu quero fazer __m256 ...

1 a resposta

Carregando um xmm dos registros do GP

Digamos que você tenha valores emrax erdx você deseja carregar em umxmm registo. Uma maneira seria: movq xmm0, rax pinsrq xmm0, rdx, 1É bem lento! Existe uma maneira melhor?