cuda выравнивание 256 байт серьезно?

В "Руководство по программированию CUDA C 5.0 ", стр73 (также здесь) говорит "Любой адрес переменной, находящейся в глобальной памяти или возвращенной одной из подпрограмм выделения памяти из драйвера или API времени выполнения, всегда выровнен как минимум до 256 байтов »., Я не знаю точного значения этого предложения. Может ли кто-нибудь показать пример для меня? Большое спасибо.

Производный вопрос: Итак, как насчет размещения одномерного массива базовых элементов (например, int) или определенных пользователем? Начальный адрес массива будет кратен 256B, в то время как адрес каждого элемента в массиве не обязательно будет кратен 256B?

Ответы на вопрос(1)

Ваш ответ на вопрос