Resultados de la búsqueda a petición "micro-optimization"

2 la respuesta

Qué microarquitectura de Intel presentó el caso especial ADC reg, 0 single-uop?

ADC en Haswell y versiones anteriores son normalmente 2 uops, con latencia de 2 ciclos, porque Intel uops tradicionalmente solo podía tener 2 entradas https: //agner.org/optimize [https://agner.org/optimize/]). Broadwell / Skylake y más tarde ...

6 la respuesta

Búsqueda rápida de algunos mordiscos en dos entradas en el mismo desplazamiento (C, microoptimización)

Mi tarea es verificar (> billones de comprobaciones), ¿dos int contienen alguno de los pares predefinidos de nibbles (primer par 0x2 0x7; segundo 0xd 0x8). Por ejemplo bit offset: 12345678 first int: 0x3d542783 first pair of 0x2 second: 0xd ...

2 la respuesta

¿Hay alguna penalización cuando base + offset está en una página diferente a la base?

Los tiempos de ejecución de estos tres fragmentos: pageboundary: dq (pageboundary + 8) ... mov rdx, [rel pageboundary] .loop: mov rdx, [rdx - 8] sub ecx, 1 jnz .loopY esto pageboundary: dq (pageboundary - 8) ... mov rdx, [rel pageboundary] ...

1 la respuesta

Extraños efectos de rendimiento de tiendas dependientes cercanas en un bucle de búsqueda de puntero en IvyBridge. Agregar una carga adicional lo acelera?

Primero tengo la configuración a continuación en un IvyBridge, insertaré el código de carga útil de medición en la ubicación comentada. Los primeros 8 bytes debuf almacenar la dirección debuf en sí, lo uso para crear una dependencia transportada ...

5 la respuesta

Java: if-return-if-return vs if-return-elseif-return

Pidió una pregunta no relacionada [https://stackoverflow.com/q/5661936/39321] donde tenía un código como este: public boolean equals(Object obj) { if (this == obj) return true; if (obj == null) return false; if (getClass() != obj.getClass()) ...

5 la respuesta

Es más rápido acceder a las variables locales finales que a las variables de clase en Java?

He estado mirando algunas de las colecciones primitivas de Java trove [http://trove.starlight-systems.com/], fastutil [http://fastutil.dsi.unimi.it/], hppc [http://labs.carrotsearch.com/hppc.html]) y he notado un patrón que las variables de ...

3 la respuesta

¿Cuál es la forma más eficiente de realizar operaciones bit a bit en una matriz C

Tengo una matriz C como: char byte_array[10]; Y otro que actúa como una máscara: char byte_mask[10]; Me gustaría obtener otra matriz que sea el resultado del primero más el segundo usando una operación bit a bit, en cada byte. ¿Cuál es la ...

1 la respuesta

¿Implicaciones de rendimiento / espacio al ordenar columnas de SQL Server?

¿Hay alguna consideración que deba tenerse en cuenta al diseñar una nueva tabla con respecto al orden en que deben declararse las columnas? Tiendo a poner primero la clave principal, seguida de cualquier clave externa (generalmente enteros de ...

7 la respuesta

a forma más rápida de quitar todos los caracteres no imprimibles de una Cadena Java

Cuál es la forma más rápida de quitar todos los caracteres no imprimibles de unaString en Java? Hasta ahora he probado y medido en una cadena de 138 bytes y 131 caracteres: String'sreplaceAll() - método más lento 517009 resultados / ...

3 la respuesta

Qué debe saber todo programador sobre la memori

Me pregunto cuánto de Ulrich Drepper'sLo que todo programador debe saber sobre la memoria [http://lwn.net/Articles/250967/] desde 2007 sigue siendo válido. Además, no pude encontrar una versión más nueva que la 1.0 o una errata.