Resultados de la búsqueda a petición "sse4"

1 la respuesta

¿Cuánto más rápido son las instrucciones de cadena SSE4.2 que SSE2 para memcmp?

Aquí está el ensamblador de mi código ¿Se puede incrustar en c ++ y verificar con SSE4? A velocidad Me gustaría mucho ver cómo entró en el desarrollo de SSE4. ¿O no está preocupado por él en absoluto? Vamos a comprobar (no tengo soporte por ...

1 la respuesta

¿Cuál es la diferencia entre __popcnt () y _mm_popcnt_u32 ()?

MS Visual C ++ admite 2 sabores de la instrucción popcnt en las CPU con SSE4.2:

3 la respuesta

SSE multiplicación 16 x uint8_t

Quiero multiplicar con SSE4 a__m128i objeto con 16 enteros de 8 bits sin signo, pero solo pude encontrar un intrínseco para multiplicar enteros de 16 bits. ¿No hay nada como_mm_mult_epi8?

1 la respuesta

_mm_testc_ps y _mm_testc_pd vs _mm_testc_si128

Como saben, los dos primeros son intrínsecos específicos de AVX y el segundo es un intrínseco SSE4.1. Ambos conjuntos de intrínsecos se pueden usar para verificar la igualdad de 2 vectores de punto flotante. Mi caso de uso ...

1 la respuesta

SSE42 y STTNI: PcmpEstrM es dos veces más lento que PcmpIstrM, ¿es cierto?