Resultados da pesquisa a pedido "x86"
Que configuração o REP faz?
CitaçãoManual de referência de otimização de arquiteturas Intel® 64 e IA-32, §2.4.6 "REP String Enhancement": As características de desempenho do uso da cadeia REP podem ser atribuídas a dois componentes:sobrecarga de inicializaçãoe taxa de ...
Não é possível mover o endereço de 8 bits para o registro de 16 bits
Eu estou tentando atribuir variável para registrar aqui é o código: ORG 100h var1 DB 10 ; var2 DB 20 ; MOV BX,var1 ; error : operands do not match: 16 bit register and 8 bit address RET ENDMas se trocar a quarta linha com: MOV BL, ...
A CPU x86_64 usa as mesmas linhas de cache para se comunicar entre 2 processos via memória compartilhada?
Como se sabe, todos os níveis do cache L1 / L2 / L3 no x86_64 moderno são virtualmente indexado, fisicamente marcado [http://www.realworldtech.com/sandy-bridge/7/]. E todos os núcleos se comunicam por meio do cache de último nível - cache-L3 ...
O segundo estágio do carregador de inicialização imprime lixo usando Int 0x10 / ah = 0x0e
Estou tentando aprender montagem e escrever um gerenciador de inicialização. O código a seguir carrega o conteúdo de uma unidade de disquete na memória e salta para ela (inicia o carregamento no endereço 0x1000). Esse código deve imprimir "X" na ...
Como executar a conversão de uint32 / float com SSE?
No SSE há uma função_mm_cvtepi32_ps(__m128i input) que recebe o vetor de entrada de números inteiros assinados com 32 bits (int32_t) e os converte emfloats. Agora, quero interpretar números inteiros de entrada como não assinados. Mas não há ...
Empacotando o BCD no DPD: Como melhorar essa rotina de montagem do amd64?
Estou escrevendo uma rotina para converter entreBCD [https://en.wikipedia.org/wiki/Binary-coded_decimal](4 bits por dígito decimal) eDecimal densamente compactado (DPD) [https://en.wikipedia.org/wiki/Densely_packed_decimal](10 bits por 3 ...
A diferença entre Call Gate, Interrupt Gate, Trap Gate?
Estou estudando o Intel Protected Mode. Descobri que o Call Gate, o Interrupt Gate, o Trap Gate são quase os mesmos. De fato, além de que o Call Gate possui os campos para o contador de parâmetros e que esses 3 portões têm campos de tipos ...
Gere automaticamente instruções FMA no MSVC
MSVC suporta instruções AVX / AVX2 há anos e de acordo comesta postagem no blog msdn [http://blogs.msdn.com/b/vcblog/archive/2014/02/28/avx2-support-in-visual-studio-c-compiler.aspx] , ele pode gerar automaticamenteFMA (Multiplicado com ...
O uso do dobro é mais rápido que o float?
Valores duplos armazenam maior precisão e têm o dobro do tamanho de um flutuador, mas as CPUs Intel são otimizadas para flutuadores? Ou seja, as operações duplas são tão rápidas ou mais rápidas que as operações flutuantes para +, -, * e /? A ...
Anomalia significativa no desempenho de FMA experimentada no processador Intel Broadwell
Código1: vzeroall mov rcx, 1000000 startLabel1: vfmadd231ps ymm0, ymm0, ymm0 vfmadd231ps ymm1, ymm1, ymm1 vfmadd231ps ymm2, ymm2, ymm2 vfmadd231ps ymm3, ymm3, ymm3 vfmadd231ps ymm4, ymm4, ymm4 vfmadd231ps ymm5, ymm5, ymm5 vfmadd231ps ymm6, ymm6, ...