Resultados da pesquisa a pedido "sse"
Primeiros passos com o SSE
Eu quero aprender mais sobre como usar oSSE.Que maneiras existem para aprender, além da leitura óbvia doArquiteturas Intel® 64 e IA-32 Manuais do desenvolved...
soma horizontal de 8 flutuadores embalados de 32 bits
Se eu tiver 8 números de ponto flutuante de 32 bits compactados (
Newton Raphson com SSE2 - alguém pode me explicar essas 3 linhas
Estou lendo este documento:http://software.intel.com/pt-pt/articles/interactive-ray-tracinge me deparei com essas três linhas de código:A versão SIMD já é um...
Multiplicação eficiente de vetor de matriz 4x4 com SSE: adição horizontal e produto escalar - qual é o objetivo?
Eu estou tentando encontrar a implementação mais eficiente de multiplicação de matriz 4x4 (M) com um vetor (u) usando SSE. Quero dizer Mu = v.Tanto quanto eu...
Por que o sqr escalar (x) SSE é mais lento que rsqrt (x) * x?
Eu tenho perfilado alguns dos nossos principais matemática em um Intel Core Duo, e ao olhar para várias abordagens para raiz quadrada eu notei algo estranho:...
Como controlar se a matemática C usa SSE2?
Entrei na montagem das funções matemáticas transcendentais da biblioteca C com o MSVC no modo fp: strict. Todos eles parecem seguir o mesmo padrão, aqui está...
Contagem rápida do número de bytes iguais entre duas matrizes
Eu escrevi a função
Melhor maneira de carregar um inteiro de 64 bits para um registro SSE2 de precisão dupla?
Qual é a melhor / mais rápida maneira de carregar um valor inteiro de 64 bits em um
Qual é a maneira correta de usar diferentes versões de intrínsecos SSE no GCC?
Eu vou fazer a minha pergunta, dando um exemplo. Agora eu tenho uma função chamada