Resultados de la búsqueda a petición "avx"

1 la respuesta

l informe @perf muestra esta función "__memset_avx2_unaligned_erms" tiene sobrecarga. ¿Significa esto que la memoria no está alineada?

Estoy tratando de perfilar mi código C ++ usando la herramienta perf. La implementación contiene código con instrucciones SSE / AVX / AVX2. Además de que el código se compila con-O3 -mavx2 -march=native banderas. ...

1 la respuesta

¿Cómo mover el doble en% rax a la posición particular de qword en% ymm o% zmm? (Kaby Lake o posterior)

La idea es que me gustaría recopilar los valores devueltos dedouble en un registro vectorial para procesar para la máquinaimm width a la vezsi almacenar de nuevo en la memoria primero. l procesamiento particular es unvfma con otros dos ...

1 la respuesta

Xcode 4 tiene soporte para AVX?

ntes de gastar tiempo y dinero descargando Xcode 4, ¿alguien puede decirme si viene con una versión de gcc (o cualquier otro compilador, por ejemplo, LLVM) que admita el conjunto de instrucciones AVX en las CPU Sandy Bridge (es decir,gcc -mavx on ...

2 la respuesta

¿Por qué gcc no resuelve _mm256_loadu_pd como un solo vmovupd?

Estoy escribiendo algunas AVX code y necesito cargar desde una memoria potencialmente desalineada. Actualmente estoy cargando 4doble, por lo tanto, usaría instrucciones intrínsecas _mm256, ...

1 la respuesta

¿Usar las instrucciones AVX deshabilita la optimización exp ()?

Estoy escribiendo una red de avance en VC ++ usando intrínsecos AVX. Invoco este código a través de PInvoke en C #. Mi rendimiento al llamar a una función que calcula un bucle grande que incluye la función exp () es ~ 1000ms para un tamaño de ...

5 la respuesta

¿Cómo verificar si una CPU admite el conjunto de instrucciones SSE3?

Es válido el siguiente código para verificar si una CPU admite el conjunto de instrucciones SSE3? Utilizando laIsProcessorFeaturePresent()a función @ aparentemente no funciona en Windows XP (verhttp: //msdn.microsoft.com/en-us/library/ms724482 ...

2 la respuesta

Utilizando instrucciones de CPU AVX: bajo rendimiento sin "/ arch: AVX"

Mi código C ++ usa SSE y ahora quiero mejorarlo para que sea compatible con AVX cuando esté disponible. Así que detecto cuando AVX está disponible y llamo a una función que usa comandos AVX. Uso Win7 SP1 + VS2010 SP1 y una CPU con AVX. Para ...

2 la respuesta

SSE cargando entradas en __m128

¿Cuáles son los intrínsecos del gcc para cargar 4ints dentro__m128 y 8 entradas en__m256 (alineado / no alineado)? Qué pasaunsigned ints?

6 la respuesta

La forma más rápida de hacer una suma vectorial horizontal con instrucciones AVX [duplicado]

Esta pregunta ya tiene una respuesta aquí: Obtenga la suma de valores almacenados en __m256d con SSE / AVX [/questions/49941645/get-sum-of-values-stored-in-m256d-with-sse-avx] 2 respuestas Tengo un vector empaquetado de cuatro valores de coma ...

10 la respuesta

Cómo usar AVX / pclmulqdq en Mac OS X

Estoy intentando compilar un programa que utiliza la instrucción pclmulqdq presente en los nuevos procesadores Intel. He instalado GCC 4.6 usando macports pero cuando compilo mi programa (que usa el intrínseco ...