Resultados da pesquisa a pedido "sse"
Como usar instruções Fused Multiply-Add (FMA) com SSE / AVX
Eu aprendi que alguns processadores Intel / AMD podem fazer multiplicação simultânea e adicionar com SSE / AVX:FLOPS por ciclo para ponte de areia e haswell ...
Acelerar um curto para flutuar elenco?
Eu tenho um curto para flutuar elenco em C + + que está bottlenecking meu código.O código traduz de um buffer de dispositivo de hardware que é nativamente cu...
SIMD e diferença entre precisão dupla compactada e escalar
Eu estou lendo o guia intrínseco da Intel enquanto estou implementando o suporte ao SIMD. Eu tenho algumas confusões e minhas perguntas são como abaixo.
O que meu compilador está fazendo? (otimizando memcpy)
Estou compilando um pouco de código usando as seguintes configurações no VC ++ 2010: / O2 / Ob2 / Oi / Ot No entanto, estou tendo problemas para entender algumas partes do assembly gerado. Coloquei algumas perguntas no código como ...
SSE divisão inteira?
Há _mm_div_ps para divisão de valores de ponto flutuante, há _mm_mullo_epi16 para multiplicação de inteiro. Mas existe algo para divisão inteira (valor de 16...
Guia intrínseco da Intel - latência e taxa de transferência
Alguém pode explicar os valores de Latência e Taxa de transferência dados noGuia intrínseco da Intel [https://software.intel.com/sites/landingpage/IntrinsicsGuide/#]? Entendi corretamente que a latência é a quantidade de unidades de tempo que ...
Multiplicação SSE de 2 inteiros de 64 bits
Como multiplicar dois inteiros de 64 bits por outros 2 inteiros de 64 bits? Eu não encontrei nenhuma instrução que possa fazer isso.