Resultados de la búsqueda a petición "avx"

1 la respuesta

l informe @perf muestra esta función "__memset_avx2_unaligned_erms" tiene sobrecarga. ¿Significa esto que la memoria no está alineada?

Estoy tratando de perfilar mi código C ++ usando la herramienta perf. La implementación contiene código con instrucciones SSE / AVX / AVX2. Además de que el código se compila con-O3 -mavx2 -march=native banderas. ...

1 la respuesta

¿Cómo mover el doble en% rax a la posición particular de qword en% ymm o% zmm? (Kaby Lake o posterior)

La idea es que me gustaría recopilar los valores devueltos dedouble en un registro vectorial para procesar para la máquinaimm width a la vezsi almacenar de nuevo en la memoria primero. l procesamiento particular es unvfma con otros dos ...

1 la respuesta

Xcode 4 tiene soporte para AVX?

ntes de gastar tiempo y dinero descargando Xcode 4, ¿alguien puede decirme si viene con una versión de gcc (o cualquier otro compilador, por ejemplo, LLVM) que admita el conjunto de instrucciones AVX en las CPU Sandy Bridge (es decir,gcc -mavx on ...

1 la respuesta

¿Usar las instrucciones AVX deshabilita la optimización exp ()?

Estoy escribiendo una red de avance en VC ++ usando intrínsecos AVX. Invoco este código a través de PInvoke en C #. Mi rendimiento al llamar a una función que calcula un bucle grande que incluye la función exp () es ~ 1000ms para un tamaño de ...

2 la respuesta

¿Cómo sumar __m256 horizontalmente?

Me gustaría sumar horizontalmente los componentes de un

2 la respuesta

Intrínsecos de dispersión en AVX

2 la respuesta

FLOPS por ciclo para Sandy-Bridge y haswell SSE2 / AVX / AVX2

Estoy confundido sobre cuántos fracasos por ciclo por núcleo se pueden hacer con Sandy-Bridge y Haswell. Como lo entiendo con SSE, deben ser 4 fracasos por c...

2 la respuesta

Cómo usar las instrucciones Fused Multiply-Add (FMA) con SSE / AVX

2 la respuesta

rendimiento de SSE y AVX cuando el ancho de banda de memoria es limitado

2 la respuesta

Los intrínsecos de registro de AVX (_mm256_log_ps) faltan en g ++ - 4.8?

Estoy tratando de utilizar algunos intrínsecos AVX en mi código y me he topado con un muro de ladrillos con los intrínsecos del logaritmo.Usando la Guía de I...