Resultados de la búsqueda a petición "micro-optimization"

14 la respuesta

Mejorando la ordenación rápida

Si es posible, ¿cómo puedo mejorar la siguiente ordenación rápida (en lo que respecta al rendimiento)? ¿Alguna sugerencia?

1 la respuesta

Pasando el puntero nulo a la colocación nueva.

La colocación por defecto

11 la respuesta

¿Qué es más rápido: muchos ifs, o si no?

Estoy iterando a través de una matriz y ordenándolos por valores en días de la semana.Para hacerlo estoy usando muchos

3 la respuesta

¿Es posible decirle al predictor de la rama qué tan probable es que siga la rama?

Solo para dejarlo claro, no voy a buscar ningún tipo de portabilidad aquí, por lo que cualquier solución que me vincule a cierta caja está bien.Básicamente, ...

2 la respuesta

Usando bools en cálculos para evitar ramas.

Aquí hay una pequeña curiosidad de micro-optimización que se me ocurrió:

2 la respuesta

Usando SIMD / AVX / SSE para el recorrido del árbol

Actualmente estoy investigando si sería posible acelerar un recorrido de árboles de van Emde Boas (o de cualquier árbol). Dada una única consulta de búsqueda...

5 la respuesta

Uso de val perezoso para almacenar en caché la representación de cadena

Encontré el siguiente código en el número especial de JAXMag Scala: package com.weiglewilczek.gameoflife case class Cell(x: Int, y: Int) { override def toString = position private lazy val position = "(%s, %s)".format(x, y) }¿El uso delazy val ...

3 la respuesta

¿Por qué DateTime.Now DateTime.UtcNow es tan lento / costoso?

Me doy cuenta de que esto está demasiado lejos en el área de micro-optimización, pero tengo curiosidad por entender por qué las llamadas a DateTime.Now y DateTime.UtcNow son tan "caras". Tengo un programa de muestra que ejecuta un par de ...

1 la respuesta

Empaquetar dos DWORD en una QWORD para ahorrar ancho de banda de la tienda

Imagine un ciclo de carga-almacenamiento como el siguiente que cargaDWORDs desde ubicaciones no contiguas y las almacena contiguamente: top: mov eax, DWORD [rsi] mov DWORD [rdi], eax mov eax, DWORD [rdx] mov DWORD [rdi + 4], eax ; unroll the ...

1 la respuesta

¿Cuánto más rápido son las instrucciones de cadena SSE4.2 que SSE2 para memcmp?

Aquí está el ensamblador de mi código ¿Se puede incrustar en c ++ y verificar con SSE4? A velocidad Me gustaría mucho ver cómo entró en el desarrollo de SSE4. ¿O no está preocupado por él en absoluto? Vamos a comprobar (no tengo soporte por ...