¿Cómo funciona este algoritmo para contar el número de bits establecidos en un entero de 32 bits?

int SWAR(unsigned int i)
{
    i = i - ((i >> 1) & 0x55555555);
    i = (i & 0x33333333) + ((i >> 2) & 0x33333333);
    return (((i + (i >> 4)) & 0x0F0F0F0F) * 0x01010101) >> 24;
}

He visto este código que cuenta el número de bits igual a1 en un entero de 32 bits, y noté que su rendimiento es mejor que__builtin_popcount pero no entiendo cómo funciona.

¿Alguien puede dar una explicación detallada de cómo funciona este código?

Respuestas a la pregunta(3)

Su respuesta a la pregunta