Lade 8bit uint8_t als uint32_t?

my Bildverarbeitungsprojekt arbeitet mit Graustufenbildern. Ich habe eine ARM Cortex-A8-Prozessorplattform. Ich möchte das NEON nutzen.

Ich habe ein Graustufenbild (siehe folgendes Beispiel) und muss in meinem Alogorithmus nur die Spalten hinzufügen.

Wie kann ich ladenvier 8-Bit-Pixelwerte parallel, die @ si uint8_t, wiefour uint32_t in eines der 128-Bit-NEON-Register? Welchen intrinsischen Wert muss ich verwenden, um dies zu tun?

Ich meine

Ich muss sie als 32 Bit laden, denn wenn Sie genau hinschauen, ist der Moment, in dem ich 255 + 255 mache, 512, was nicht in einem 8-Bit-Register gespeichert werden kann.

z.B

255 255 255 255 ......... (640 pixels)
255 255 255 255
255 255 255 255
255 255 255 255
.
.
.
.
.
(480 pixels) 

Antworten auf die Frage(10)

Ihre Antwort auf die Frage