or que algumas latências do Haswell AVX anunciadas pela Intel são 3x mais lentas que o Sandy Bridg
Na Intelintrinsics webapp, várias operações parecem ter piorado de Sandy Bridge para Haswell. Por exemplo, muitas operações de inserção como _mm256_insertf128_si256 mostram uma tabela de custos como a seguinte:
Performance
Architecture Latency Throughput
Haswell 3 -
Ivy Bridge 1 -
Sandy Bridge 1 -
Achei essa diferença intrigante. É essa diferença porque existem novas instruções que substituem essas ou algo que as compensa (quais)? Alguém sabe se a Skylake muda ainda mais esse modelo?