Что означает выравнивание по 16-байтовой границе в x86
Официальное руководство по оптимизации Intel есть глава о преобразовании команд MMX в SSE, где они устанавливают следующий статус:
Computation instructions which use a memory operand that may not be aligned to a 16-byte boundary must be replaced with an unaligned 128-bit load (MOVDQU) followed by the same computation operation that uses instead register operands.
(глава 5.8 Преобразование из 64-битных в 128-битные целые числа SIMD, стр. 5-43)
Я не могу понять, что они имеют в виду под "не может быть выровнен по 16-байтовой границе", не могли бы вы уточнить это и привести несколько примеров?