Как работает этот алгоритм для подсчета количества установленных бит в 32-разрядном целом числе?

int SWAR(unsigned int i)
{
    i = i - ((i >> 1) & 0x55555555);
    i = (i & 0x33333333) + ((i >> 2) & 0x33333333);
    return (((i + (i >> 4)) & 0x0F0F0F0F) * 0x01010101) >> 24;
}

Я видел этот код, который считает количество бит равным1 в 32-разрядном целом числе, и я заметил, что его производительность лучше, чем__builtin_popcount но я не могу понять, как это работает.

Может кто-нибудь дать подробное объяснение того, как работает этот код?

Ответы на вопрос(3)

Ваш ответ на вопрос