Jak synchronizowana jest pamięć podręczna instrukcji x86?

Question

Jun 12, 2012, 03:10 AM

assembly self-modifying cpu-cache c instructions

Jak synchronizowana jest pamięć podręczna instrukcji x86?

Lubię przykłady, więc napisałem trochę samo modyfikującego się kodu w c ...

#include <stdio.h>
#include <sys/mman.h> // linux

int main(void) {
    unsigned char *c = mmap(NULL, 7, PROT_READ|PROT_WRITE|PROT_EXEC, MAP_PRIVATE|
                            MAP_ANONYMOUS, -1, 0); // get executable memory
    c[0] = 0b11000111; // mov (x86_64), immediate mode, full-sized (32 bits)
    c[1] = 0b11000000; // to register rax (000) which holds the return value
                       // according to linux x86_64 calling convention 
    c[6] = 0b11000011; // return
    for (c[2] = 0; c[2] < 30; c[2]++) { // incr immediate data after every run
        // rest of immediate data (c[3:6]) are already set to 0 by MAP_ANONYMOUS
        printf("%d ", ((int (*)(void)) c)()); // cast c to func ptr, call ptr
    }
    putchar('\n');
    return 0;
}

... który działa najwyraźniej:

>>> gcc -Wall -Wextra -std=c11 -D_GNU_SOURCE -o test test.c; ./test
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Ale szczerze mówiąc, nieoczekiwać to w ogóle działa. Spodziewałem się instrukcji zawierającejc[2] = 0 do buforowania przy pierwszym wywołaniuc, po czym wszystkie kolejne połączenia doc ignorowałby powtarzające się zmianyc (chyba że jakoś w jakiś sposób unieważniłem pamięć podręczną). Na szczęście mój procesor wydaje się być mądrzejszy.

Domyślam się, że procesor porównuje pamięć RAM (zakładającc nawet znajduje się w pamięci RAM) z pamięcią podręczną instrukcji, gdy wskaźnik instrukcji powoduje duży skok (tak jak w przypadku wywołania powyższej pamięci) i unieważnia pamięć podręczną, gdy nie pasuje (wszystko?), ale ja mam nadzieję uzyskać dokładniejsze informacje na ten temat. W szczególności chciałbym wiedzieć, czy to zachowanie można uznać za przewidywalne (z wyjątkiem różnic sprzętowych i os), i na których polegało?

(Prawdopodobnie powinienem zapoznać się z instrukcją Intela, ale ta rzecz ma tysiące stron i często się w niej gubię ...)