Resultados de la búsqueda a petición "micro-optimization"

Si es posible, ¿cómo puedo mejorar la siguiente ordenación rápida (en lo que respecta al rendimiento)? ¿Alguna sugerencia?

c++noexcept placement-new

1 la respuesta

Pasando el puntero nulo a la colocación nueva.

La colocación por defecto

php

11 la respuesta

¿Qué es más rápido: muchos ifs, o si no?

Estoy iterando a través de una matriz y ordenándolos por valores en días de la semana.Para hacerlo estoy usando muchos

x86 c compiler-optimization gcc

3 la respuesta

¿Es posible decirle al predictor de la rama qué tan probable es que siga la rama?

Solo para dejarlo claro, no voy a buscar ningún tipo de portabilidad aquí, por lo que cualquier solución que me vincule a cierta caja está bien.Básicamente, ...

optimization boolean c++11 c++

2 la respuesta

Usando bools en cálculos para evitar ramas.

Aquí hay una pequeña curiosidad de micro-optimización que se me ocurrió:

assembly simd avx performance

2 la respuesta

Usando SIMD / AVX / SSE para el recorrido del árbol

Actualmente estoy investigando si sería posible acelerar un recorrido de árboles de van Emde Boas (o de cualquier árbol). Dada una única consulta de búsqueda...

lazy-evaluation scala

5 la respuesta

Uso de val perezoso para almacenar en caché la representación de cadena

Encontré el siguiente código en el número especial de JAXMag Scala: package com.weiglewilczek.gameoflife case class Cell(x: Int, y: Int) { override def toString = position private lazy val position = "(%s, %s)".format(x, y) }¿El uso delazy val ...

c#performance

3 la respuesta

¿Por qué DateTime.Now DateTime.UtcNow es tan lento / costoso?

Me doy cuenta de que esto está demasiado lejos en el área de micro-optimización, pero tengo curiosidad por entender por qué las llamadas a DateTime.Now y DateTime.UtcNow son tan "caras". Tengo un programa de muestra que ejecuta un par de ...

performance assembly optimization x86

1 la respuesta

Empaquetar dos DWORD en una QWORD para ahorrar ancho de banda de la tienda

Imagine un ciclo de carga-almacenamiento como el siguiente que cargaDWORDs desde ubicaciones no contiguas y las almacena contiguamente: top: mov eax, DWORD [rsi] mov DWORD [rdi], eax mov eax, DWORD [rdx] mov DWORD [rdi + 4], eax ; unroll the ...

assembly x86 sse sse4

1 la respuesta

¿Cuánto más rápido son las instrucciones de cadena SSE4.2 que SSE2 para memcmp?

Aquí está el ensamblador de mi código ¿Se puede incrustar en c ++ y verificar con SSE4? A velocidad Me gustaría mucho ver cómo entró en el desarrollo de SSE4. ¿O no está preocupado por él en absoluto? Vamos a comprobar (no tengo soporte por ...

Página 2 de 6

123 4 5

Resultados de la búsqueda a petición "micro-optimization"

Mejorando la ordenación rápida

Pasando el puntero nulo a la colocación nueva.

¿Qué es más rápido: muchos ifs, o si no?

Etiquetas Populares

¿Es posible decirle al predictor de la rama qué tan probable es que siga la rama?

Usando bools en cálculos para evitar ramas.

Usando SIMD / AVX / SSE para el recorrido del árbol

Uso de val perezoso para almacenar en caché la representación de cadena

¿Por qué DateTime.Now DateTime.UtcNow es tan lento / costoso?

Empaquetar dos DWORD en una QWORD para ahorrar ancho de banda de la tienda

¿Cuánto más rápido son las instrucciones de cadena SSE4.2 que SSE2 para memcmp?

¡Eres muy activo! ¡Es genial!

Resultados de la búsqueda a petición "micro-optimization"

Etiquetas Populares