Resultados de la búsqueda a petición "micro-optimization"

14 la respuesta

Mejorando la ordenación rápida

Si es posible, ¿cómo puedo mejorar la siguiente ordenación rápida (en lo que respecta al rendimiento)? ¿Alguna sugerencia?

12 la respuesta

Modelo de costo x86 moderno

Estoy escribiendo un compilador JIT con un backend x86 y aprendiendo el ensamblador x86 y el código de la máquina a medida que avanzo. Utilicé el ensamblador ARM hace unos 20 años y me sorprende la diferencia en los modelos de costo entre estas ...

1 la respuesta

Cargar un xmm desde GP regs

Digamos que tiene valores enrax yrdx desea cargar en unaxmm registrarse. Una forma sería: movq xmm0, rax pinsrq xmm0, rdx, 1 ¡Aunque es bastante lento! ¿Hay una mejor manera?

5 la respuesta

Uso de val perezoso para almacenar en caché la representación de cadena

Encontré el siguiente código en el número especial de JAXMag Scala: package com.weiglewilczek.gameoflife case class Cell(x: Int, y: Int) { override def toString = position private lazy val position = "(%s, %s)".format(x, y) }¿El uso delazy val ...

2 la respuesta

Instrucción INC vs ADD 1: ¿Importa?

DeIra Baxter responde:¿Por qué las instrucciones INC y DEC?noafectar la bandera de transporte (CF)? [https://stackoverflow.com/a/13435633/124486] Principalmente, me mantengo alejado deINC yDEC ahora, porque hacen actualizaciones parciales del ...

6 la respuesta

Búsqueda rápida de algunos mordiscos en dos entradas en el mismo desplazamiento (C, microoptimización)

Mi tarea es verificar (> billones de comprobaciones), ¿dos int contienen alguno de los pares predefinidos de nibbles (primer par 0x2 0x7; segundo 0xd 0x8). Por ejemplo bit offset: 12345678 first int: 0x3d542783 first pair of 0x2 second: 0xd ...

1 la respuesta

latency vs throughput en intel intrinsics

Creo que tengo una comprensión decente de la diferencia entre latencia y rendimiento, en general. Sin embargo, las implicaciones de la latencia en el rendimiento de la instrucción no me resultan claras para Intel Intrinsics, particularmente ...

1 la respuesta

Pasando el puntero nulo a la colocación nueva.

La colocación por defecto

7 la respuesta

División de punto flotante vs multiplicación de punto flotante

¿Hay alguna ganancia (no micro-optimización) de rendimiento al codificar float f1 = 200f / 2en comparación con float f2 = 200f * 0.5n profesor mío me dijo hace unos años que las divisiones de punto flotante eran más lentas que las ...

3 la respuesta

Qué debe saber todo programador sobre la memori

Me pregunto cuánto de Ulrich Drepper'sLo que todo programador debe saber sobre la memoria [http://lwn.net/Articles/250967/] desde 2007 sigue siendo válido. Además, no pude encontrar una versión más nueva que la 1.0 o una errata.