Implementação atômica C ++ 0x na pergunta c ++ 98 sobre __sync_synchronize ()

Escrevi o seguinte modelo atômico com o objetivo de imitar as operações atômicas que estarão disponíveis no próximo padrão c ++ 0x.

No entanto, não tenho certeza de que a chamada __sync_synchronize () que eu tenho em torno do retorno do valor subjacente seja necessária.

Pelo meu entendimento, __sync_synchronize () é uma barreira de memória cheia e não tenho certeza se preciso de uma chamada tão cara ao retornar o valor do objeto.

Tenho certeza de que será necessário em torno da configuração do valor, mas eu também poderia implementar isso com o assembly ..

__asm__ __volatile__ ( "rep;nop": : :"memory" );

Alguém sabe se eu definitivamente preciso da sincronização () no retorno do objeto.

M.

template < typename T >
struct atomic
{
private:
    volatile T obj;

public:
    atomic( const T & t ) :
        obj( t )
    {
    }

    inline operator T()
    {
        __sync_synchronize();   // Not sure this is overkill
        return obj;
    }

    inline atomic< T > & operator=( T val )
    {
        __sync_synchronize();   // Not sure if this is overkill
        obj = val;
        return *this;
    }

    inline T operator++()
    {
        return __sync_add_and_fetch( &obj, (T)1 );
    }

    inline T operator++( int )
    {
        return __sync_fetch_and_add( &obj, (T)1 );
    }

    inline T operator+=( T val )
    {
        return __sync_add_and_fetch( &obj, val );
    }

    inline T operator--()
    {
        return __sync_sub_and_fetch( &obj, (T)1 );
    }

    inline T operator--( int )
    {
        return __sync_fetch_and_sub( &obj, (T)1 );
    }

    inline T operator-=( T )
    {
        return __sync_sub_and_fetch( &obj, val );
    }

    // Perform an atomic CAS operation
    // returning the value before the operation
    inline T exchange( T oldVal, T newVal )
    {
        return __sync_val_compare_and_swap( &obj, oldval, newval );
    }

};

Atualização: quero garantir que as operações sejam consistentes em face da nova ordem de leitura / gravação devido às otimizações do compilador.

questionAnswers(2)

yourAnswerToTheQuestion