Resultados de la búsqueda a petición "x86"
Implementación alternativa para la detección de conflictos en AVX2
AVX512CD contiene el intrínseco_mm512_conflict_epi32(__m512i a) devuelve un vector donde para cada elemento ena se establece un bit si tiene el mismo valor. ¿Hay alguna manera de hacer algo similar en AVX2? No estoy interesado en los bits ...
Hacer visibles las tiendas de memoria anteriores para las cargas de memoria posteriores
Quiero almacenar datos en una gran matriz con_mm256_stream_si256() llamado en un bucle. Como entendí, se necesita una cerca de memoria para hacer que estos cambios sean visibles para otros hilos. La descripción de_mm_sfence() dice Realice una ...
Asamblea x86: Excepción de coma flotante de división dividida por 11
Estoy tratando de dividir859091 por11 para obtener el cociente y el resto, pero obtengo la excepción de punto flotante en línea: div bx Este es mi código paraSASM: %include "io.inc" section .data dividend dd 859091 divisor dw 11 section ...
Compilador utilizando variables locales sin ajustar RSP
En cuestiónCompiladores: comprensión del código de ensamblaje generado a partir de pequeños programas [https://stackoverflow.com/questions/42994231/compilers-understanding-assembly-code-generated-from-small-programs/42994347#42994347] el ...
Instrucciones de la máquina contadora usando gdb
Necesito estimar la ubicación exacta de inicio de algunos puntos de acceso en un programa, en términos de conteo de instrucciones de máquina x86 (para que luego pueda ejecutarse en algún emulador / simulador). ¿Hay alguna manera de usar gdb para ...
¿Cuál es la secuencia de instrucciones de recopilación stride-3 más rápida?
La pregunta:¿Cuál es la secuencia más eficiente para generar una reunión stride-3 de elementos de 32 bits de la memoria? Si la memoria está organizada como: MEM = R0 G0 B0 R1 G1 B1 R2 G2 B2 R3 G3 B3 ...Queremos obtener tres registros ...
Forma fácil de almacenar en caché los resultados de varios subprocesos
ConsiderarN subprocesos que realizan algunas tareas asincrónicas con un valor de resultado pequeño comodouble oint64_t. Entonces sobre8 los valores de resultado pueden caber en una sola línea de caché de CPU.N es igual al número de núcleos de ...
¿Qué sucede cuando usa un prefijo de anulación de memoria pero todos los operandos son registros?
¿Qué sucede cuando usa un prefijo de anulación de memoria pero todos los operandos son registros? Entonces, digamos que codificasmov eax, ebx oadd eax, ebxy el valor predeterminado es de 32 bits, pero utiliza una anulación de 67 h. ¿Cómo maneja ...
un programa simple de lenguaje ensamblador en línea "Hello World" en C / C ++
yo uso devcpp y borland c compilador .... asm { mov ax,4 // (I/O Func.) mov bx,1 // (Output func) mov cx,&name // (address of the string) mov dx,6 // (length of the string) int 0x21 // system call }en los fragmentos de código anteriores quiero ...
Endianness dentro de los registros de la CPU
Necesito ayuda para comprender la resistencia dentro de los registros de CPU de los procesadores x86. Escribí este pequeño programa de ensamblaje: section .data section .bss section .text global _start _start: nop mov eax, 0x78FF5ABC mov ...