FLOPS за цикл для песчаного моста и скважины SSE2 / AVX / AVX2

Я не понимаю, сколько флопов за такт на ядро можно сделать с помощью Sandy-Bridge и Haswell. Насколько я понимаю, с SSE должно быть 4 флопа на такт на ядро для SSE и 8 флопс на такт на ядро для AVX / AVX2.

Это, кажется, проверено здесь,Как мне достичь теоретического максимума 4 FLOP за цикл? ,и здесь,Спецификация процессора Sandy-Bridge.

Однако приведенная ниже ссылка указывает на то, что Sandy-bridge может делать 16 флопов за цикл на ядро, а Haswell 32 флопа на цикл на ядроhttp://www.extremetech.com/computing/136219-intels-haswell-is-an-unprecedented-threat-to-nvidia-amd.

Может кто-то объяснить это мне?

Изменить: теперь я понимаю, почему я был смущен. Я думал, что термин FLOP относится только к одной с плавающей точкой (SP). Теперь я вижу, что тест вКак мне достичь теоретического максимума 4 FLOP за цикл? фактически на двойной плавающей запятой (DP), поэтому они достигают 4 DP FLOP / цикл для SSE и 8 DP FLOP / цикл для AVX. Было бы интересно повторить этот тест на SP.

Ответы на вопрос(2)

Ваш ответ на вопрос