Resultados da pesquisa a pedido "sse"
prático BigNum AVX / SSE possível?
Os registros SSE / AVX podem ser vistos como BigNums de ponto flutuante ou inteiro. Ou seja, pode-se negligenciar a existência de pistas. Existe uma maneira fácil de explorar esse ponto de vista e usar esses registros como BigNums individualmente ...
Qual é a diferença entre intrínsecas lógicas do SSE?
Existe alguma diferença entre intrínsecas lógicas do SSE para tipos diferentes? Por exemplo, se usarmos a operação OR, existem três intrínsecos: _mm_or_ps, _mm_or_pd e _mm_or_si128, os quais fazem a mesma coisa: computarbit a bit OU de seus ...
SIMD assinado com multiplicação não assinada para 64 bits * 64 bits a 128 bits
Eu criei uma função que executa de 64 bits * de 64 bits a 128 bits usando o SIMD. Atualmente eu o implementei usando o SSE2 (SSE4.1). Isso significa que ele faz dois produtos de 64b * 64b a 128b ao mesmo tempo. A mesma idéia pode ser estendida ao ...
Verificando se o SSE é suportado no tempo de execução [duplicado]
Esta pergunta já tem uma resposta aqui: Como verificar se uma CPU suporta o conjunto de instruções SSE3? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 respostasdespachante cpu para visual studio para AVX e ...
Traduzindo SSE para Neon: Como compactar e extrair o resultado de 32 bits
Eu tenho que traduzir as seguintes instruções de SSE para Neon uint32_t a = _mm_cvtsi128_si32(_mm_shuffle_epi8(a,SHUFFLE_MASK) );Onde: static const __m128i SHUFFLE_MASK = _mm_setr_epi8(3, 7, 11, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, ...
Intrínsecas Constexpr e SSE
A maioria dos compiladores C ++ oferece suporte a instruções SIMD (SSE / AVX) com recursos como _mm_cmpeq_epi32Meu problema com isso é que essa função não está marcada comoconstexpr, embora "semanticamente" não haja motivo para essa função ...
Como converter um flutuador hexadecimal em um flutuador em C / C ++ usando a função instrinc _Emm_extract_ps SSE GCC
Estou escrevendo um código SSE para convolução 2D, mas a documentação do SSE é muito escassa. Estou calculando o produto escalar com _mm_dp_ps e usando _mm_extract_ps para obter o resultado do produto escalar, mas _mm_extract_ps retorna um ...
Quantos ciclos de clock custam exponenciação AVX / SSE na moderna CPU x86_64?
Quantos ciclos de clock custam exponenciação AVX / SSE na moderna CPU x86_64? Eu estou prestes:pow(x, y) = exp(y*log(x)) [https://stackoverflow.com/questions/25936031/pow-for-sse-types] I.e. faz ambosexp() elog() As instruções AVX x86_64 ...
As diferentes versões mmx, sse e avx são complementares ou superconjuntos?
Estou pensando em me familiarizar com as extensões x86 SIMD. Mas antes mesmo de começar, tive problemas. Não consigo encontrar uma boa visão geral sobre quais deles ainda são relevantes. A arquitetura x86 acumulou muitas extensões de matemática ...
Como habilito o SSE para meu código inicializável independente?
(Esta pergunta era originalmente sobre oCVTSI2SD instruções e o fato de que pensei que não funcionava na CPU Pentium M, mas na verdade é porque estou usando um sistema operacional personalizado e preciso ativar manualmente o SSE.) Eu tenho uma ...