Загрузить 8bit uint8_t как uint32_t?

мой проект обработки изображений работает с изображениями в градациях серого. У меня ARM Cortex-A8 процессорная платформа. Я хочу использовать НЕОН.

У меня есть изображение в градациях серого (рассмотрим пример ниже), и в моем алгоритме я должен добавить только столбцы.

Как я могу загрузитьчетыре 8-битных значения пикселей параллельно, которыеuint8_t, какчетыре uint32_t в один из 128-битных регистров NEON? Что мне нужно использовать для этого?

Я имею в виду:

Я должен загрузить их как 32-битные, потому что, если вы посмотрите внимательно, момент, когда я делаю 255 + 255, равен 512, что не может быть сохранено в 8-битном регистре.

например

255 255 255 255 ......... (640 pixels)
255 255 255 255
255 255 255 255
255 255 255 255
.
.
.
.
.
(480 pixels) 

Ответы на вопрос(5)

Ваш ответ на вопрос