Resultados da pesquisa a pedido "sse"

1 a resposta

Nova sintaxe de instruções do AVX

Eu tinha um código C escrito com alguns intel-intrinsincs. Depois de compilá-lo primeiro com avx e depois com sinalizadores ssse3, obtive dois códigos de montagem bem diferentes. Por exemplo: AVX: vpunpckhbw %xmm0, %xmm1, %xmm2SSSE3: movdqa ...

1 a resposta

Qual é a diferença entre __popcnt () e _mm_popcnt_u32 ()?

O MS Visual C ++ suporta 2 sabores da instrução popcnt em CPUs com SSE4.2:

3 a resposta

Como executar o deslocamento à esquerda do elemento com __m128i?

As instruções de mudança de SSE que encontrei só podem mudar na mesma quantia em todos os elementos:

5 a resposta

Arquivos de cabeçalho para intrínsecos do SIM86 x86

1 a resposta

AVX2, como carregar com eficiência quatro números inteiros em índices pares de um registro de 256 bits e copiar em índices ímpares?

Eu tenho uma matriz alinhada de números inteiros na memória contendo os índices I0, I1, I2, I3. Meu objetivo é colocá-los em um registro __m256i contendo I0, I0 + 1, I1, I1 + 1, I2, I2 + 1, I3, I3 + 1. A parte mais difícil é colocá-los ...

1 a resposta

vetor de __mm128 não irá push_back ()

Este código SSE simples:

5 a resposta

É possível converter floats diretamente para __m128 se eles estiverem alinhados com 16 bytes?

É seguro / possível / aconselhável lançar carros alegóricos diretamente para

3 a resposta

SSE _mm_movemask_epi8 método equivalente para ARM NEON

1 a resposta

SIMD o seguinte código

Como faço para SIMIDizar o seguinte código em C (usando intrinsics SIMD claro)? Estou tendo problemas para entender os intrínsecos do SIMD e isso ajudaria mu...

1 a resposta

Deslocando 4 números inteiros para a direita por valores diferentes SIMD

O SSE não fornece uma maneira de mudar números inteiros compactados por uma quantidade variável (eu posso usar qualquer instrução AVX e mais antiga). Você só pode fazer turnos uniformes. O resultado que estou tentando obter para cada número ...