Implementación atómica C ++ 0x en la pregunta c ++ 98 sobre __sync_synchronize ()

He escrito la siguiente plantilla atómica con el fin de imitar las operaciones atómicas que estarán disponibles en el próximo estándar c ++ 0x.

Sin embargo, no estoy seguro de que la llamada __sync_synchronize () que tengo alrededor de la devolución del valor subyacente sea necesaria.

Según tengo entendido, __sync_synchronize () es una barrera de memoria completa y no estoy seguro de necesitar una llamada tan costosa al devolver el valor del objeto.

Estoy bastante seguro de que será necesario en torno a la configuración del valor, pero también podría implementar esto con el ensamblaje.

__asm__ __volatile__ ( "rep;nop": : :"memory" );

¿Alguien sabe si definitivamente necesito sincronizar () al devolver el objeto.

METRO.

template < typename T >
struct atomic
{
private:
    volatile T obj;

public:
    atomic( const T & t ) :
        obj( t )
    {
    }

    inline operator T()
    {
        __sync_synchronize();   // Not sure this is overkill
        return obj;
    }

    inline atomic< T > & operator=( T val )
    {
        __sync_synchronize();   // Not sure if this is overkill
        obj = val;
        return *this;
    }

    inline T operator++()
    {
        return __sync_add_and_fetch( &obj, (T)1 );
    }

    inline T operator++( int )
    {
        return __sync_fetch_and_add( &obj, (T)1 );
    }

    inline T operator+=( T val )
    {
        return __sync_add_and_fetch( &obj, val );
    }

    inline T operator--()
    {
        return __sync_sub_and_fetch( &obj, (T)1 );
    }

    inline T operator--( int )
    {
        return __sync_fetch_and_sub( &obj, (T)1 );
    }

    inline T operator-=( T )
    {
        return __sync_sub_and_fetch( &obj, val );
    }

    // Perform an atomic CAS operation
    // returning the value before the operation
    inline T exchange( T oldVal, T newVal )
    {
        return __sync_val_compare_and_swap( &obj, oldval, newval );
    }

};

Actualización: Quiero asegurarme de que las operaciones sean consistentes frente al reordenamiento de lectura / escritura debido a las optimizaciones del compilador.

Respuestas a la pregunta(2)

Su respuesta a la pregunta