Intel Inspector zgłasza wyścig danych w mojej implementacji spinlocka

Zrobiłem bardzo prosty spinlock używając funkcji Interlocked w Windows i przetestowałem go na dwurdzeniowym CPU (dwa wątki, które zwiększają zmienną);

Program wydaje się działać OK (daje taki sam wynik za każdym razem, co nie ma miejsca, gdy nie jest używana synchronizacja), aleIntel Parallel Inspector mówi, że istnieje sytuacja rasowawartość + = j (zobacz poniższy kod). Ostrzeżenie znika, gdy zamiast sekcji SpinLock używane są sekcje krytyczne.

Czy moja implementacja SpinLock jest poprawna, czy nie? To naprawdę dziwne, ponieważ wszystkie używane operacje są atomowe i mają odpowiednie bariery pamięciowe i nie powinny prowadzić do warunków wyścigu.

class SpinLock
{
   int *lockValue;
   SpinLock(int *value) : lockValue(value) { }

   void Lock() {
      while(InterlockedCompareExchange((volatile LONG*)lockValue, 1, 0) != 0) {
          WaitABit();
      }
   }

   void Unlock() { InterlockedExchange((volatile LONG*)lockValue, 0); }
};

Program testowy:

static const int THREADS = 2;
HANDLE completedEvents[THREADS];
int value = 0;
int lock = 0; // Global.

DWORD WINAPI TestThread(void *param) {
    HANDLE completed = (HANDLE)param;
    SpinLock testLock(&lock);

    for(int i = 0;i < 1000*20; i++) {
        for(int j = 0;j < 10*10; j++) {
            // Add something to the variable.
            testLock.Lock();
            value += j;
            testLock.Unlock();
        }
    }
    SetEvent(completed);
}

int main() {
   for(int i = 0; i < THREADS; i++) {
        completedEvents[i] = CreateEvent(NULL, true, false, NULL);
   }
   for(int i = 0; i < THREADS; i++) {
        DWORD id;
        CreateThread(NULL, 0, TestThread, completedEvents[i], 0, &id);
   }

   WaitForMultipleObjects(THREADS, completedEvents, true, INFINITE);
   cout<<value;
}

questionAnswers(3)

yourAnswerToTheQuestion