Resultados da pesquisa a pedido "avx"
Onde está o intrínseco '_mm256_pow_ps' de Clang?
Não consigo encontrar os intrínsecos para _mm_pow_ps ou _mm256_pow_ps, os quais devem estar incluídos no 'immintrin.h'. Clang não define isso ou eles estão em um cabeçalho que não estou incluindo?
_mm_testc_ps e _mm_testc_pd vs _mm_testc_si128
Como você sabe, os dois primeiros são intrínsecos específicos ao AVX e o segundo é um intrínseco SSE4.1. Ambos os conjuntos de intrínsecos podem ser usados para verificar a igualdade de 2 vetores de ponto flutuante. Meu caso de uso específico ...
s versões SIMD mais antigas estão disponíveis ao usar as mais nova
Quando posso usar o SSE3 ou o AVX, existem versões mais antigas do SSE como SSE2 ou MMX disponíveis - ou ainda preciso checá-los separadamente?
existe uma instrução inversa à instrução movemask no intel avx
As instruções movemask usam um __m256i e retornam um int32 em que cada bit (os primeiros 4, 8 ou todos os 32 bits, dependendo do tipo de elemento do vetor de entrada) é o bit mais significativo do elemento vetorial correspondent Gostaria de ...
aneira mais rápida de multiplicar uma matriz de int64_
Quero vetorizar a multiplicação de duas matrizes alinhadas à memória. Não encontrei nenhuma maneira de multiplicar 64 * 64 bits no AVX / AVX2, então apenas desenrolei o loop e carregue / armazene o AVX2. Existe uma maneira mais rápida de fazer ...
Por que o gcc não resolve _mm256_loadu_pd como um único vmovupd?
Estou escrevendo alguns AVX e eu preciso carregar da memória potencialmente desalinhada. Atualmente, estou carregando 4 doubles, portanto, eu usaria instruções intrínsecas _mm256, _loadu_pd [https://software.intel.com/en-us/node/524102]; o ...
O Xcode 4 tem suporte para AVX?
Antes de gastar tempo e dinheiro baixando o Xcode 4, alguém pode me dizer se ele vem com uma versão do gcc (ou qualquer outro compilador, por exemplo, LLVM) que suporta as instruções AVX definidas nas CPUs Sandy Bridge (ou seja,gcc -mavx nas ...
Utilizar as instruções do AVX desativa a otimização exp ()?
Estou escrevendo uma rede de encaminhamento de feed em VC ++ usando intrínsecas AVX. Estou invocando esse código via PInvoke em C #. Meu desempenho ao chamar uma função que calcula um loop grande, incluindo a função exp (), é ~ 1000ms para um ...
Como verificar se uma CPU suporta o conjunto de instruções SSE
O código a seguir é válido para verificar se uma CPU suporta o conjunto de instruções SSE Usando oIsProcessorFeaturePresent()parentemente, a função @ não funciona no Windows XP (consultehttp: //msdn.microsoft.com/en-us/library/ms724482 (v ...
Usando as instruções da CPU do AVX: Baixo desempenho sem “/ arch: AVX”
Meu código C ++ usa SSE e agora quero aprimorá-lo para dar suporte ao AVX quando estiver disponível. Por isso, detecto quando o AVX está disponível e chamo uma função que usa os comandos do AVX. Eu uso o Win7 SP1 + VS2010 SP1 e uma CPU com ...