Resultados de la búsqueda a petición "x86"

1 la respuesta

Implementación alternativa para la detección de conflictos en AVX2

AVX512CD contiene el intrínseco_mm512_conflict_epi32(__m512i a) devuelve un vector donde para cada elemento ena se establece un bit si tiene el mismo valor. ¿Hay alguna manera de hacer algo similar en AVX2? No estoy interesado en los bits ...

2 la respuesta

Hacer visibles las tiendas de memoria anteriores para las cargas de memoria posteriores

Quiero almacenar datos en una gran matriz con_mm256_stream_si256() llamado en un bucle. Como entendí, se necesita una cerca de memoria para hacer que estos cambios sean visibles para otros hilos. La descripción de_mm_sfence() dice Realice una ...

1 la respuesta

Asamblea x86: Excepción de coma flotante de división dividida por 11

Estoy tratando de dividir859091 por11 para obtener el cociente y el resto, pero obtengo la excepción de punto flotante en línea: div bx Este es mi código paraSASM: %include "io.inc" section .data dividend dd 859091 divisor dw 11 section ...

1 la respuesta

Compilador utilizando variables locales sin ajustar RSP

En cuestiónCompiladores: comprensión del código de ensamblaje generado a partir de pequeños programas [https://stackoverflow.com/questions/42994231/compilers-understanding-assembly-code-generated-from-small-programs/42994347#42994347] el ...

3 la respuesta

Instrucciones de la máquina contadora usando gdb

Necesito estimar la ubicación exacta de inicio de algunos puntos de acceso en un programa, en términos de conteo de instrucciones de máquina x86 (para que luego pueda ejecutarse en algún emulador / simulador). ¿Hay alguna manera de usar gdb para ...

2 la respuesta

¿Cuál es la secuencia de instrucciones de recopilación stride-3 más rápida?

La pregunta:¿Cuál es la secuencia más eficiente para generar una reunión stride-3 de elementos de 32 bits de la memoria? Si la memoria está organizada como: MEM = R0 G0 B0 R1 G1 B1 R2 G2 B2 R3 G3 B3 ...Queremos obtener tres registros ...

2 la respuesta

Forma fácil de almacenar en caché los resultados de varios subprocesos

ConsiderarN subprocesos que realizan algunas tareas asincrónicas con un valor de resultado pequeño comodouble oint64_t. Entonces sobre8 los valores de resultado pueden caber en una sola línea de caché de CPU.N es igual al número de núcleos de ...

1 la respuesta

¿Qué sucede cuando usa un prefijo de anulación de memoria pero todos los operandos son registros?

¿Qué sucede cuando usa un prefijo de anulación de memoria pero todos los operandos son registros? Entonces, digamos que codificasmov eax, ebx oadd eax, ebxy el valor predeterminado es de 32 bits, pero utiliza una anulación de 67 h. ¿Cómo maneja ...

2 la respuesta

un programa simple de lenguaje ensamblador en línea "Hello World" en C / C ++

yo uso devcpp y borland c compilador .... asm { mov ax,4 // (I/O Func.) mov bx,1 // (Output func) mov cx,&name // (address of the string) mov dx,6 // (length of the string) int 0x21 // system call }en los fragmentos de código anteriores quiero ...

4 la respuesta

Endianness dentro de los registros de la CPU

Necesito ayuda para comprender la resistencia dentro de los registros de CPU de los procesadores x86. Escribí este pequeño programa de ensamblaje: section .data section .bss section .text global _start _start: nop mov eax, 0x78FF5ABC mov ...