Resultados da pesquisa a pedido "sse"

2 a resposta

Como usar instruções Fused Multiply-Add (FMA) com SSE / AVX

Eu aprendi que alguns processadores Intel / AMD podem fazer multiplicação simultânea e adicionar com SSE / AVX:FLOPS por ciclo para ponte de areia e haswell ...

7 a resposta

Acelerar um curto para flutuar elenco?

Eu tenho um curto para flutuar elenco em C + + que está bottlenecking meu código.O código traduz de um buffer de dispositivo de hardware que é nativamente cu...

2 a resposta

SIMD e diferença entre precisão dupla compactada e escalar

Eu estou lendo o guia intrínseco da Intel enquanto estou implementando o suporte ao SIMD. Eu tenho algumas confusões e minhas perguntas são como abaixo.

3 a resposta

O que meu compilador está fazendo? (otimizando memcpy)

Estou compilando um pouco de código usando as seguintes configurações no VC ++ 2010: / O2 / Ob2 / Oi / Ot No entanto, estou tendo problemas para entender algumas partes do assembly gerado. Coloquei algumas perguntas no código como ...

3 a resposta

A __int128_t aritmética é emulada pelo GCC, mesmo com o SSE?

4 a resposta

SSE divisão inteira?

Há _mm_div_ps para divisão de valores de ponto flutuante, há _mm_mullo_epi16 para multiplicação de inteiro. Mas existe algo para divisão inteira (valor de 16...

3 a resposta

Como posso verificar se meu numpy instalado é compilado com o conjunto de instruções SSE / SSE2?

1 a resposta

Guia intrínseco da Intel - latência e taxa de transferência

Alguém pode explicar os valores de Latência e Taxa de transferência dados noGuia intrínseco da Intel [https://software.intel.com/sites/landingpage/IntrinsicsGuide/#]? Entendi corretamente que a latência é a quantidade de unidades de tempo que ...

4 a resposta

C ++ usam instruções SSE para comparar vetores enormes de ints

3 a resposta

Multiplicação SSE de 2 inteiros de 64 bits

Como multiplicar dois inteiros de 64 bits por outros 2 inteiros de 64 bits? Eu não encontrei nenhuma instrução que possa fazer isso.