Resultados de la búsqueda a petición "x86"
¿Está LFENCE serializando en procesadores AMD?
n documentos recientes de Intel ISA, ellfencea instrucción @ se ha definido comoserializando el flujo de instrucciones (evitando la ejecución fuera de orden en él). En particular, ladescripció [http://felixcloutier.com/x86/LFENCE.html] de la ...
¿Por qué es x86 little endian?
Una pregunta real que me he estado haciendo últimamente es ¿qué opciones de diseño provocaron que x86 fuera una pequeña arquitectura endian en lugar de una gran arquitectura endian?
¿Por qué Intel cambió el mecanismo de predicción de rama estática durante estos años?
Desdeaqu [https://groups.google.com/forum/#!topic/mechanical-sympathy/pMN6TbXwOUc] Sé que Intel implementó varios mecanismos de predicción de rama estática en estos años: 80486 edad: siempre no tomado Pentium4 age: Hacia atrás tomado / Hacia ...
Determine la frecuencia de TSC en Linux
Dado un x86 con un TSC constante [https://stackoverflow.com/a/51907627/149138], que es útil para medir el tiempo real, ¿cómo se puede convertir entre las "unidades" de los ciclos de referencia de TSC y las unidades humanas normales en tiempo real ...
¿`Xchg` abarca` mfence` suponiendo que no hay instrucciones no temporales?
Ya he vistoesta respuesta [https://stackoverflow.com/a/50279772/391161] yesta respuesta [https://stackoverflow.com/a/19099164/391161], pero ninguno parece claro y explícito sobre la equivalencia o no equivalencia demfence yxchg bajo el supuesto ...
Alcanzar el rendimiento de Numba con Cython
Por lo general, puedo igualar el rendimiento de Numba cuando uso Cython. Sin embargo, en este ejemplo no he podido hacerlo: Numba es aproximadamente 4 veces más rápido que la versión de mi Cython. Aquí la versión de Cython: %%cython ...
bootloader: cambio del procesador al modo protegido
Tengo dificultades para entender cómo funciona un simple gestor de arranque. El gestor de arranque del que estoy hablando es el del curso de MIT "Ingeniería de sistemas operativos". Primero, déjame mostrarte un código de ensamblaje que ejecuta ...
Cómo convertir eficientemente un mapa de bits de 8 bits a una matriz de enteros 0/1 con x86 SIMD
Quiero convertir un entero de 8 bits en una matriz de tamaño 8 con cada valor que contenga el valor de bit de un entero. Por ejemplo: tengoint8_t x = 8; Quiero convertir esto aint8_t array_x = {0,0,0,0,1,0,0,0}; Esto tiene que hacerse de ...
Minimizar fallas de página (y fallas TLB) mientras "camina" un gráfico grande
Problema (piense en la fase de marca de un GC) Tengo un gráfico de "objetos" que necesito caminar, visitando todos los objetos. Puedo almacenar en cada objeto si ha sido visitado. Todos los objetos se almacenan en la memoria y se vinculan entre ...
¿Hay alguna penalización cuando base + offset está en una página diferente a la base?
Los tiempos de ejecución de estos tres fragmentos: pageboundary: dq (pageboundary + 8) ... mov rdx, [rel pageboundary] .loop: mov rdx, [rdx - 8] sub ecx, 1 jnz .loopY esto pageboundary: dq (pageboundary - 8) ... mov rdx, [rel pageboundary] ...