Resultados da pesquisa a pedido "sse"
Qual é o significado de acessos de memória "não temporal" em x86
Essa é uma pergunta de nível inferior. Na montagem x86, existem duas instruções SSE: MOVDQA xmmi, m128 e MOVNTDQA xmmi, m128 O Manual do Desenvolvedor de Software IA-32 diz que oNT no MOVNTDQA significaNão Temporale, caso contrário, é o mesmo ...
s versões SIMD mais antigas estão disponíveis ao usar as mais nova
Quando posso usar o SSE3 ou o AVX, existem versões mais antigas do SSE como SSE2 ou MMX disponíveis - ou ainda preciso checá-los separadamente?
latency vs throughput em intel intrinsics
Acho que tenho um entendimento decente da diferença entre latência e taxa de transferência, em geral. No entanto, as implicações da latência na taxa de transferência de instruções não são claras para o Intel Intrinsics, principalmente ao usar ...
SSE: carregamento e armazenamento desalinhados que cruzam o limite da página
Li em algum lugar que antes de executar carregamento desalinhado ou armazene próximo ao limite da página (por exemplo, usando_mm_loadu_si128 / _mm_storeu_si128 intrinsics), o código deve primeiro verificar se o vetor inteiro (neste caso, 16 ...
como posso usar instruções SVML [duplicado]
Esta pergunta já tem uma resposta aqui: Erro C ++: '_mm_sin_ps' não foi declarado neste escopo [/questions/31978592/c-error-mm-sin-ps-was-not-declared-in-this-scope] 3 respostasOnde é intrínseco o '_mm256_pow_ps' de ...
inlining falhou na chamada para always_inline '__m128i _mm_cvtepu8_epi32 (__ m128i)': incompatibilidade de opção específica do destino _mm_cvtepu8_epi32 (__m128i __X) [duplicado]
Esta pergunta já tem uma resposta aqui: inlining falhou na chamada para always_inline '_mm_mullo_epi32': segmentar incompatibilidade de opção ...
Intel SSE: Por que `_mm_extract_ps` retorna` int` em vez de `float`?
Porque_mm_extract_ps retorna umint em vez de umfloat? Qual é a maneira correta de ler um únicofloat de um registro XMM em C? Ou melhor, uma maneira diferente de perguntar é: Qual é o oposto do_mm_set_ps instrução?
sando instruções S
Eu tenho um loop escrito em C ++ que é executado para cada elemento de uma grande matriz inteira. Dentro do loop, mascarei alguns bits do número inteiro e, em seguida, localizo os valores mínimo e máximo. Ouvi dizer que se eu usar as instruções ...
Filtro linear com intrínsecas SSE4.1
Estou tentando descobrir uma função de filtragem bilinear razoavelmente rápida apenas para uma amostra filtrada de cada vez, agora, como um exercício para se acostumar ao uso de intrínsecos - até SSE41 é bo té agora, tenho o seguinte: inline ...
Como verificar se uma CPU suporta o conjunto de instruções SSE
O código a seguir é válido para verificar se uma CPU suporta o conjunto de instruções SSE Usando oIsProcessorFeaturePresent()parentemente, a função @ não funciona no Windows XP (consultehttp: //msdn.microsoft.com/en-us/library/ms724482 (v ...