Resultados da pesquisa a pedido "sse"

8 a resposta

Como os dados de um vetor estão alinhados?

Se eu quiser processar dados em umstd::vector com SSE, preciso de alinhamento de 16 bytes. Como posso conseguir isso? Preciso escrever meu próprio alocador? Ou o alocador padrão já está alinhado aos limites de 16 bytes?

3 a resposta

adicionando os componentes de um registro SSE

Quero adicionar os quatro componentes de um registro SSE para obter um único flutuador. É assim que faço agora: float a[4]; _mm_storeu_ps(a, foo128); float x = a[0] + a[1] + a[2] + a[3]; Existe uma instrução SSE que alcança isso diretament

2 a resposta

Como converter _m128i em um int sem assinatura com SSE?

Eu criei uma função para posterizar imagens. // =( #define ARGB_COLOR(a, r, g, b) (((a) << 24) | ((r) << 16) | ((g) << 8) | (b)) inline UINT PosterizeColor(const UINT &color, const float &nColors) { __m128 clr = _mm_cvtepi32_ps( ...

3 a resposta

SESE mais lento que o FPU?

Tenho um grande pedaço de código, parte de cujo corpo contém esse pedaço de código: result = (nx * m_Lx + ny * m_Ly + m_Lz) / sqrt(nx * nx + ny * ny + 1);que eu vectorizei da seguinte forma (tudo já é umfloat): __m128 r = ...

4 a resposta

SE: converte inteiro curto para float

Quero converter uma matriz de números curtos não assinados para flutuar usando o SSE. Digamo __m128i xVal; // Has 8 16-bit unsigned integers __m128 y1, y2; // 2 xmm registers for 8 float valuesQuero primeiro 4 uint16 em y1 e próximos 4 uint16 ...

2 a resposta

SSE carregando ints no __m128

O que é intrínseco ao gcc para carregar 4ints para dentro__m128 e 8 polegadas em__m256 (alinhado / desalinhado)? A respeitounsigned ints?

6 a resposta

aneira mais rápida de fazer soma de vetores horizontal com instruções AVX [duplicado]

Esta pergunta já tem uma resposta aqui: Obtenha a soma dos valores armazenados em __m256d com SSE / AVX [/questions/49941645/get-sum-of-values-stored-in-m256d-with-sse-avx] 2 respostas Tenho um vetor compactado de quatro valores de ponto ...