inlining falló en la llamada a always_inline '__m128i _mm_cvtepu8_epi32 (__ m128i)': la opción específica de destino no coincide _mm_cvtepu8_epi32 (__m128i __X) [duplicado]

Esta pregunta ya tiene una respuesta aquí:

inlining falló en la llamada a always_inline ‘_mm_mullo_epi32’: la opción específica de destino no coincide 1 respuesta

Estoy tratando de compilareste proyect de github que se implementa en C ++ con SIMD intrínseco (SSE4.1). El proyecto en github se ofrece como una solución de Visual Studio, pero estoy tratando de portarlo en Qtcreator con cmake. Mientras intento compilarlo, aparece el siguiente error:

/usr/lib/gcc/x86_64-unknown-linux-gnu/5.3.0/include/smmintrin.h:520:1: error: inlining failed in call to always_inline '__m128i _mm_cvtepu8_epi32(__m128i)': target specific option mismatch
 _mm_cvtepu8_epi32 (__m128i __X)

que estoy seguro de que tiene que ver con la parte de optimización de SSE, pero como no estoy tan familiarizado con este tema, no sé realmente qué significa y cómo puedo resolverlo y en la red que busqué no pude Realmente obtener algo útil. El código que da el siguiente problema es el siguiente:

static void cvt8u32f(const Mat& src, Mat& dest, const float amp)
{
    const int imsize = src.size().area()/8;
    const int nn = src.size().area()- imsize*8 ;
    uchar* s = (uchar*)src.ptr(0);
    float* d = dest.ptr<float>(0);
    const __m128 mamp = _mm_set_ps1(amp);
    const __m128i zero = _mm_setzero_si128();
    for(int i=imsize;i--;)
    {
        __m128i s1 = _mm_loadl_epi64((__m128i*)s);

        _mm_store_ps(d,_mm_mul_ps(mamp,_mm_cvtepi32_ps(_mm_cvtepu8_epi32(s1))));
        _mm_store_ps(d+4,_mm_mul_ps(mamp,_mm_cvtepi32_ps(_mm_cvtepu8_epi32(_mm_srli_si128(s1,4)))));
        s+=8;
        d+=8;
    }
    for(int i=0;i<nn;i++)
    {
        *d = (float)*s * amp;
        s++,d++;
    }

}

alguien puede explicarme cuál es el problema y lo que me falta. Gracias por adelantado

Respuestas a la pregunta(1)

Su respuesta a la pregunta