Resultados da pesquisa a pedido "sse"
Nova sintaxe de instruções do AVX
Eu tinha um código C escrito com alguns intel-intrinsincs. Depois de compilá-lo primeiro com avx e depois com sinalizadores ssse3, obtive dois códigos de montagem bem diferentes. Por exemplo: AVX: vpunpckhbw %xmm0, %xmm1, %xmm2SSSE3: movdqa ...
Qual é a diferença entre __popcnt () e _mm_popcnt_u32 ()?
O MS Visual C ++ suporta 2 sabores da instrução popcnt em CPUs com SSE4.2:
Como executar o deslocamento à esquerda do elemento com __m128i?
As instruções de mudança de SSE que encontrei só podem mudar na mesma quantia em todos os elementos:
AVX2, como carregar com eficiência quatro números inteiros em índices pares de um registro de 256 bits e copiar em índices ímpares?
Eu tenho uma matriz alinhada de números inteiros na memória contendo os índices I0, I1, I2, I3. Meu objetivo é colocá-los em um registro __m256i contendo I0, I0 + 1, I1, I1 + 1, I2, I2 + 1, I3, I3 + 1. A parte mais difícil é colocá-los ...
vetor de __mm128 não irá push_back ()
Este código SSE simples:
É possível converter floats diretamente para __m128 se eles estiverem alinhados com 16 bytes?
É seguro / possível / aconselhável lançar carros alegóricos diretamente para
SIMD o seguinte código
Como faço para SIMIDizar o seguinte código em C (usando intrinsics SIMD claro)? Estou tendo problemas para entender os intrínsecos do SIMD e isso ajudaria mu...
Deslocando 4 números inteiros para a direita por valores diferentes SIMD
O SSE não fornece uma maneira de mudar números inteiros compactados por uma quantidade variável (eu posso usar qualquer instrução AVX e mais antiga). Você só pode fazer turnos uniformes. O resultado que estou tentando obter para cada número ...