Resultados da pesquisa a pedido "micro-optimization"
Melhorando a classificação rápida
Se possível, como posso melhorar a seguinte classificação rápida (desempenho sábio). Alguma sugestão?
Passando o ponteiro nulo para o novo posicionamento
O canal padrão
O que é mais rápido: muitos ifs, senão se?
Estou interagindo com uma matriz e classificando-a por valores em dias da semana.Para fazer isso estou usando muitos
É possível dizer ao preditor de ramo como é provável seguir o ramo?
Só para deixar claro, eu não estou indo para qualquer tipo de portabilidade aqui, então qualquer solução que me amarre a uma certa caixa está bem.Basicamente...
Usando SIMD / AVX / SSE para travessia de árvore
Atualmente, estou pesquisando se seria possível acelerar a travessia de uma árvore Emma Boas (ou qualquer árvore). Dada uma única consulta de pesquisa como e...
Por que o DateTime.Now DateTime.UtcNow é tão lento / caro
Sei que isso é muito longe na área de micro-otimização, mas estou curioso para entender por que as chamadas para DateTime.Now e DateTime.UtcNow são tão "caras". Eu tenho um programa de exemplo que executa alguns cenários de "trabalho" ...
Quão mais rápidas são as instruções de sequência do SSE4.2 que o SSE2 para o memcmp?
Aqui está o assembler do meu código Você pode incorporá-lo em c ++ e verificar o SSE4? A velocidade Eu gostaria muito de ver como entrou no desenvolvimento do SSE4. Ou não está preocupado com ele? Vamos verificar (não tenho suporte acima do ...
Por que o NASM no Linux altera os registros no assembly x86_64
Eu sou novo na programação de montagem x86_64. Eu estava escrevendo o programa "Hello World" simples na montagem x86_64. Abaixo está o meu código, que funciona perfeitamente bem. global _start section .data msg: db "Hello to the world of ...
Quais métodos podem ser usados para estender eficientemente o comprimento das instruções no x86 moderno?
Imagine que você deseja alinhar uma série de instruções de montagem x86 para determinados limites. Por exemplo, convém alinhar os loops a um limite de 16 ou 32 bytes ou empacotar instruções para que sejam eficientemente colocados no cache uop ou ...