SIMD y diferencia entre doble precisión empacada y escalar.

Estoy leyendo la guía de intrínsecos de Intel mientras implemento el soporte SIMD. Tengo algunas confusiones y mis preguntas son las siguientes.

__m128 _mm_cmpeq_ps (__m128 a, __m128 b) La documentación dice que se utiliza para comparar puntos flotantes de precisión simple empaquetados. ¿Qué significa "empacado"? ¿Debo empaquetar mis valores de flotación de alguna manera antes de poder usarlos?

Por doble precisión hay intrínsecos como_mm_cmpeq_sd lo que significa comparar los elementos de punto flotante de precisión doble "inferior". ¿Qué significan los elementos de precisión doble inferior y superior? ¿Puedo usarlos para comparar un vector de C ++?double escribe elementos o no? ¿O necesito procesarlos de alguna manera antes de compararlos?

Respuestas a la pregunta(2)

Su respuesta a la pregunta