Implementierung eines C ++ - SSE-Filters

Ich habe versucht, mit SSE 4-Pixel-Operationen durchzuführen. Ich habe Probleme beim Laden der Bilddaten auf __m128. Meine Bilddaten sind ein Zeichenpuffer. Angenommen, mein Bild ist 1024 x 1024. Mein Filter ist 16x16.

__m128 IMG_VALUES, FIL_VALUES, NEW_VALUES;
//ok:
IMG_VALUES=_mm_load_ps(&pInput[0]);
//hang below:
IMG_VALUES=_mm_load_ps(&pInput[1]);

Ich weiß nicht, wie ich mit Index 1,2,3 umgehen soll ... danke.

Antworten auf die Frage(1)

Ihre Antwort auf die Frage