Resultados de la búsqueda a petición "intrinsics"

1 la respuesta

¿Qué es __m128d?

Realmente no puedo obtener qué "palabra clave" como__m128d está en C ++. Estoy usando MSVC yes [https://docs.microsoft.com/en-us/cpp/cpp/m128d?view=vs-2017] dice:The __m128d data type, for use with the Streaming SIMD Extensions 2 instructions ...

1 la respuesta

¿Cómo mover el doble en% rax a la posición particular de qword en% ymm o% zmm? (Kaby Lake o posterior)

La idea es que me gustaría recopilar los valores devueltos dedouble en un registro vectorial para procesar para la máquinaimm width a la vezsi almacenar de nuevo en la memoria primero. l procesamiento particular es unvfma con otros dos ...

1 la respuesta

Constexpr y SSE intrínsecos

os compiladores @Most C ++ admiten instrucciones SIMD (SSE / AVX) con elementos intrínsecos como _mm_cmpeq_epi32Mi problema con esto es que esta función no está marcada comoconstexpr, aunque "semánticamente" no hay razón para que esta función ...

2 la respuesta

_umul128 en Windows 32 bits

En Visual C ++, _umul128 no está definido cuando se dirige a Windows 32 bits. ¿Cómo se pueden multiplicar dos enteros de 64 bits sin signo al apuntar a Win32? La solución solo necesita funcionar en Visual C ++ 2017 dirigido a Windows 32 bits.

1 la respuesta

NEON pack vector compara resultado en mapa de bits

Tengo un resultado de comparación de la comparación de dos operandos de coma flotante de la siguiente manera; Lo que necesito hacer se basa en el resultado de la comparación que necesito para realizar lo siguiente: es decir: neon_gt_res = ...

1 la respuesta

¿Falta los intrínsecos AVX-512 para las máscaras?

Guía intrínseca de Intelenumera una serie de intrínsecos [https://software.intel.com/sites/landingpage/IntrinsicsGuide/#!=u ndefined&text=_mm512_k&expand=3537,3537,89,750,3039&techs=AVX_512]para las instrucciones de la máscara AVX-512 K *, pero ...

1 la respuesta

Implementación alternativa para la detección de conflictos en AVX2

AVX512CD contiene el intrínseco_mm512_conflict_epi32(__m512i a) devuelve un vector donde para cada elemento ena se establece un bit si tiene el mismo valor. ¿Hay alguna manera de hacer algo similar en AVX2? No estoy interesado en los bits ...

1 la respuesta

latency vs throughput en intel intrinsics

Creo que tengo una comprensión decente de la diferencia entre latencia y rendimiento, en general. Sin embargo, las implicaciones de la latencia en el rendimiento de la instrucción no me resultan claras para Intel Intrinsics, particularmente ...

1 la respuesta

Guía de Intel Intrinsics - Latencia y rendimiento

¿Alguien puede explicar los valores de Latencia y Rendimiento dados en elGuía intrínseca de Intel [https://software.intel.com/sites/landingpage/IntrinsicsGuide/#]? ¿He entendido correctamente que la latencia es la cantidad de unidades de ...

2 la respuesta

Caso de prueba para adcx y adox

Estoy probandoIntel ADX [https://en.wikipedia.org/wiki/Intel_ADX]agregar con carry y agregar con desbordamiento a pipeline agrega enteros grandes. Me gustaría ver cómo debería ser la generación de código esperada. De_addcarry_u64 y _addcarryx_u64 ...