or que algumas latências do Haswell AVX anunciadas pela Intel são 3x mais lentas que o Sandy Bridg

Na Intelintrinsics webapp, várias operações parecem ter piorado de Sandy Bridge para Haswell. Por exemplo, muitas operações de inserção como _mm256_insertf128_si256 mostram uma tabela de custos como a seguinte:

   Performance
 Architecture   Latency   Throughput
 Haswell        3         -
 Ivy Bridge     1         - 
 Sandy Bridge   1         - 

Achei essa diferença intrigante. É essa diferença porque existem novas instruções que substituem essas ou algo que as compensa (quais)? Alguém sabe se a Skylake muda ainda mais esse modelo?

questionAnswers(1)

yourAnswerToTheQuestion