Resultados da pesquisa a pedido "sse4"

3 a resposta

SSE multiplicação 16 x uint8_t

Quero multiplicar com SSE4 a__m128i objeto com 16 números inteiros de 8 bits não assinados, mas só consegui encontrar um intrínseco para multiplicar números inteiros de 16 bits. Não existe nada como_mm_mult_epi8?

1 a resposta

SSE42 & STTNI - PcmpEstrM é duas vezes mais lento que PcmpIstrM, é verdade?

Estou experimentando as instruções SSE42 e STTNI e obtive um resultado estranho -PcmpEstrM(funciona com cadeias de comprimento explícitas) é executadoduas vezes mais lento que PcmpIstrM(cadeias de comprimento implícitas). No meui7 3610QMa ...

1 a resposta

Qual é a diferença entre __popcnt () e _mm_popcnt_u32 ()?

O MS Visual C ++ suporta 2 sabores da instrução popcnt em CPUs com SSE4.2:

1 a resposta

Quão mais rápidas são as instruções de sequência do SSE4.2 que o SSE2 para o memcmp?

Aqui está o assembler do meu código Você pode incorporá-lo em c ++ e verificar o SSE4? A velocidade Eu gostaria muito de ver como entrou no desenvolvimento do SSE4. Ou não está preocupado com ele? Vamos verificar (não tenho suporte acima do ...

1 a resposta

_mm_testc_ps e _mm_testc_pd vs _mm_testc_si128

Como você sabe, os dois primeiros são intrínsecos específicos ao AVX e o segundo é um intrínseco SSE4.1. Ambos os conjuntos de intrínsecos podem ser usados para verificar a igualdade de 2 vetores de ponto flutuante. Meu caso de uso específico ...