l informe @perf muestra esta función "__memset_avx2_unaligned_erms" tiene sobrecarga. ¿Significa esto que la memoria no está alineada?

Estoy tratando de perfilar mi código C ++ usando la herramienta perf. La implementación contiene código con instrucciones SSE / AVX / AVX2. Además de que el código se compila con-O3 -mavx2 -march=native banderas. Yo creo__memset_avx2_unaligned_ermsa función @ es una implementación libc dememset. perf muestra que esta función tiene una sobrecarga considerable. El nombre de la función indica que la memoria no está alineada, sin embargo, en el código estoy alineando explícitamente la memoria utilizando la macro incorporada GCC__attribute__((aligned (x))) ¿Cuál podría ser la razón para que esta función tenga una sobrecarga significativa y también por qué se llama a la versión no alineada aunque la memoria esté alineada explícitamente?

He adjuntado el informe de muestra como imagen.

Respuestas a la pregunta(1)

Su respuesta a la pregunta