Resultados da pesquisa a pedido "avx"

2 a resposta

Verificando se o SSE é suportado no tempo de execução [duplicado]

Esta pergunta já tem uma resposta aqui: Como verificar se uma CPU suporta o conjunto de instruções SSE3? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 respostasdespachante cpu para visual studio para AVX e ...

2 a resposta

Acesso à memória alinhado e não alinhado com intrínsecas AVX / AVX2

De acordo com o Manual do desenvolvedor de software da Intel (seção 14.9), o AVX relaxou os requisitos de alinhamento dos acessos à memória. Se os dados forem carregados diretamente em uma instrução de processamento, por exemplo, vaddps ...

2 a resposta

Classificando estruturas de 64 bits usando o AVX?

Eu tenho uma estrutura de 64 bits que representa várias partes de dados, uma das quais é um valor de ponto flutuante: struct MyStruct{ uint16_t a; uint16_t b; float f; };e eu tenho quatro dessas estruturas, digamosstd::array<MyStruct, 4> é ...

2 a resposta

As diferentes versões mmx, sse e avx são complementares ou superconjuntos?

Estou pensando em me familiarizar com as extensões x86 SIMD. Mas antes mesmo de começar, tive problemas. Não consigo encontrar uma boa visão geral sobre quais deles ainda são relevantes. A arquitetura x86 acumulou muitas extensões de matemática ...

2 a resposta

Como escrever código c ++ que o compilador pode compilar com eficiência para SSE ou AVX?

Digamos que eu tenha uma função escrita em c ++ que execute multiplicações de vetores de matriz em muitos vetores. É necessário um ponteiro para a matriz de vetores a ser transformada. Estou correto ao supor que o compilador não pode otimizar ...

2 a resposta

Gere automaticamente instruções FMA no MSVC

MSVC suporta instruções AVX / AVX2 há anos e de acordo comesta postagem no blog msdn [http://blogs.msdn.com/b/vcblog/archive/2014/02/28/avx2-support-in-visual-studio-c-compiler.aspx] , ele pode gerar automaticamenteFMA (Multiplicado com ...

2 a resposta

Os índices de bytes diferentes de zero de um registro SSE / AVX

Se o valor de um registro SSE / AVX for tal que todos os seus bytes sejam 0 ou 1, existe alguma maneira de obter com eficiência os índices de todos os elementos diferentes de zero? Por exemplo, se o valor xmm for | r0 = 0 | r1 = 1 | r2 = 0 | r3 ...

2 a resposta

Qual é a versão mínima do OS X para uso com o AVX / AVX2?

Eu tenho uma rotina de desenho de imagem que é compilada várias vezes para SSE, SSE2, SSE3, SSE4.1, SSE4.2, AVX e AVX2. Meu programa envia dinamicamente uma dessas variações binárias verificando sinalizadores CPUID. No Windows, verifico a versão ...

2 a resposta

Por que esse código SSE é 6 vezes mais lento sem o VZEROUPPER no Skylake?

Eu tenho tentado descobrir um problema de desempenho em um aplicativo e finalmente o reduzi a um problema realmente estranho. O código a seguir é executado 6 vezes mais devagar em uma CPU Skylake (i5-6500) se oVZEROUPPER a instrução é comentada. ...

2 a resposta

Convenção para exibição de registros vetoriais

Existe uma convenção para exibir / gravar registros grandes, como os disponíveis no conjunto de instruções do Intel AVX? Por exemplo, se você tiver 1 no byte menos significativo e 20 no byte mais significativo e 0 em outro lugar de umxmm ...