Resultados da pesquisa a pedido "sse"

3 a resposta

Qual é o significado de acessos de memória "não temporal" em x86

Essa é uma pergunta de nível inferior. Na montagem x86, existem duas instruções SSE: MOVDQA xmmi, m128 e MOVNTDQA xmmi, m128 O Manual do Desenvolvedor de Software IA-32 diz que oNT no MOVNTDQA significaNão Temporale, caso contrário, é o mesmo ...

3 a resposta

s versões SIMD mais antigas estão disponíveis ao usar as mais nova

Quando posso usar o SSE3 ou o AVX, existem versões mais antigas do SSE como SSE2 ou MMX disponíveis - ou ainda preciso checá-los separadamente?

1 a resposta

latency vs throughput em intel intrinsics

Acho que tenho um entendimento decente da diferença entre latência e taxa de transferência, em geral. No entanto, as implicações da latência na taxa de transferência de instruções não são claras para o Intel Intrinsics, principalmente ao usar ...

1 a resposta

SSE: carregamento e armazenamento desalinhados que cruzam o limite da página

Li em algum lugar que antes de executar carregamento desalinhado ou armazene próximo ao limite da página (por exemplo, usando_mm_loadu_si128 / _mm_storeu_si128 intrinsics), o código deve primeiro verificar se o vetor inteiro (neste caso, 16 ...

1 a resposta

como posso usar instruções SVML [duplicado]

Esta pergunta já tem uma resposta aqui: Erro C ++: '_mm_sin_ps' não foi declarado neste escopo [/questions/31978592/c-error-mm-sin-ps-was-not-declared-in-this-scope] 3 respostasOnde é intrínseco o '_mm256_pow_ps' de ...

1 a resposta

inlining falhou na chamada para always_inline '__m128i _mm_cvtepu8_epi32 (__ m128i)': incompatibilidade de opção específica do destino _mm_cvtepu8_epi32 (__m128i __X) [duplicado]

Esta pergunta já tem uma resposta aqui: inlining falhou na chamada para always_inline '_mm_mullo_epi32': segmentar incompatibilidade de opção ...

4 a resposta

Intel SSE: Por que `_mm_extract_ps` retorna` int` em vez de `float`?

Porque_mm_extract_ps retorna umint em vez de umfloat? Qual é a maneira correta de ler um únicofloat de um registro XMM em C? Ou melhor, uma maneira diferente de perguntar é: Qual é o oposto do_mm_set_ps instrução?

15 a resposta

sando instruções S

Eu tenho um loop escrito em C ++ que é executado para cada elemento de uma grande matriz inteira. Dentro do loop, mascarei alguns bits do número inteiro e, em seguida, localizo os valores mínimo e máximo. Ouvi dizer que se eu usar as instruções ...

2 a resposta

Filtro linear com intrínsecas SSE4.1

Estou tentando descobrir uma função de filtragem bilinear razoavelmente rápida apenas para uma amostra filtrada de cada vez, agora, como um exercício para se acostumar ao uso de intrínsecos - até SSE41 é bo té agora, tenho o seguinte: inline ...

5 a resposta

Como verificar se uma CPU suporta o conjunto de instruções SSE

O código a seguir é válido para verificar se uma CPU suporta o conjunto de instruções SSE Usando oIsProcessorFeaturePresent()parentemente, a função @ não funciona no Windows XP (consultehttp: //msdn.microsoft.com/en-us/library/ms724482 (v ...