Resultados da pesquisa a pedido "x86"
Instruções SIMD para comparação de igualdade de ponto flutuante (com NaN == NaN)
Quais instruções seriam usadas para comparar dois vetores de 128 bits que consistem em valores de ponto flutuante de 4 * 32 bits? Existe uma instrução que considere igual o valor de NaN em ambos os lados? Caso contrário, qual o tamanho do ...
Quais são as melhores seqüências de instruções para gerar constantes vetoriais em tempo real?
"Melhor" significa o menor número de instruções (ou o menor número de uops, se houver alguma instrução decodificada para mais de um uop). O tamanho do código da máquina em bytes é um desempatador para igual número de insn. A geração constante é, ...
Como implementar atoi usando SIMD?
Eu gostaria de tentar escrever uma implementação atoi usando instruções SIMD, para ser incluída noRapidJSON [http://rapidjson.org/](uma biblioteca de leitor / gravador C ++ JSON). Atualmente, há algumas otimizações do SSE2 e SSE4.2 em outros ...
Multiplicação flutuante executando mais lentamente, dependendo dos operandos em C
Estou executando um cálculo de estêncil em uma matriz que li anteriormente de um arquivo. Eu uso dois tipos diferentes de matrizes (tipo diferente de zero e tipo zero). Ambos os tipos compartilham o valor dos limites (geralmente 1000), enquanto ...
O que significam 'prefixos de instruções' no x86 moderno
Para entender o porquê do Bulldozer ser inferior, estive analisando o excelente livro de microarquitetura da Agner Fog, nele na página 178, no bulldozer, este parágrafo. Instruções com até três prefixos podem ser decodificadas em um ciclo de ...
Código de montagem fsqrt e fmul instruções
Estou tentando calcular1.34 *sqrt(lght) nesta função usando assembly embutido, mas estou recebendo erros como: '_asm' não declarado (primeiro uso nesta função) cada identificador não declarado é relatado apenas uma vez para cada função que ...
Série Fibonacci na montagem x86
Finalmente, após uma longa sessão de inúmeros erros, espero que este seja o final. Sem erros de compilação ou tempo de execução, apenas um erro lógico. EDIT: (Pseudocódigo fixo) Meu Pseudocódigo: first = 1; second = 1; third = 0; for i from 1 ...
Como faço para abrir espaço para minha caverna de código em um executável do Windows PE 32 bits
Então, eu quero criar um espaço para minhas cavernas de código no minesweeper.exe (jogo típico do Windows XP minesweeper, link:Campo Minado [http://www.minesweeper.info/downloads/WinmineXP.html]) Então, modifiquei o cabeçalho PE do arquivo via ...
O que são indicadores próximos, distantes e enormes?
Alguém pode me explicar esses ponteiros com um exemplo adequado ... e quando esses ponteiros são usados?
O x86 pode reordenar um armazenamento estreito com uma carga mais ampla que o contenha totalmente?
Manual do desenvolvedor de software das arquiteturas Intel® 64 e IA-32 [https://www-ssl.intel.com/content/dam/www/public/us/en/documents/manuals/64-ia-32-architectures-software-developer-system-programming-manual-325384.pdf] diz: 8.2.3.4 As ...