Resultados de la búsqueda a petición "avx"

2 la respuesta

Comprobando si SSE es compatible en tiempo de ejecución [duplicado]

Esta pregunta ya tiene una respuesta aquí: ¿Cómo verificar si una CPU admite el conjunto de instrucciones SSE3? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 respuestasdespachador de CPU para Visual Studio para ...

1 la respuesta

AVX: alineación de datos: bloqueo de tienda, storeu, carga, loadu no

Estoy modificando RNNLM una red neuronal para estudiar el modelo de lenguaje. Sin embargo, dado el tamaño de mi cuerpo, funciona muy lento. Traté de optimizar la rutina de vectores de matriz * (que es responsable del 63% del tiempo total para un ...

1 la respuesta

Contenedor para `__m256` Producir falla de segmentación con el constructor - Windows 64 + MinGW + AVX Issues

Tengo una unión que se ve así union bareVec8f { __m256 m256; //avx 8x float vector float floats[8]; int ints[8]; inline bareVec8f(){ } inline bareVec8f(__m256 vec){ this->m256 = vec; } inline bareVec8f &operator=(__m256 m256) { this->m256 = ...

2 la respuesta

Acceso a la memoria alineado y no alineado con intrínsecos AVX / AVX2

De acuerdo con el Manual del desarrollador de software de Intel (sección 14.9), AVX relajó los requisitos de alineación de los accesos a la memoria. Si los datos se cargan directamente en una instrucción de procesamiento, p. vaddps ...

2 la respuesta

¿Las diferentes versiones mmx, sse y avx son complementarias o supersets entre sí?

Estoy pensando en familiarizarme con las extensiones x86 SIMD. Pero incluso antes de comenzar, me encontré con problemas. No puedo encontrar una buena descripción sobre cuáles de ellos siguen siendo relevantes. La arquitectura x86 ha acumulado ...

2 la respuesta

¿Ordenar estructuras de 64 bits con AVX?

Tengo una estructura de 64 bits que representa varios datos, uno de los cuales es un valor de coma flotante: struct MyStruct{ uint16_t a; uint16_t b; float f; };y tengo cuatro de estas estructuras, digamos unstd::array<MyStruct, 4> ¿Es posible ...

1 la respuesta

¿Cuántos ciclos de reloj cuesta la exponenciación AVX / SSE en la CPU moderna x86_64?

¿Cuántos ciclos de reloj cuesta la exponenciación AVX / SSE en la CPU moderna x86_64? Estoy a punto de:pow(x, y) = exp(y*log(x)) [https://stackoverflow.com/questions/25936031/pow-for-sse-types] Es decir. Haz ambosexp() ylog() ¿Las instrucciones ...

3 la respuesta

¿Cómo resolver el problema de la alineación de 32 bytes para las operaciones de carga / almacenamiento de AVX?

Tengo problemas de alineación mientras usoymm registros, con algunos fragmentos de código que me parecen bien. Aquí hay un ejemplo de trabajo mínimo: #include <iostream> #include <immintrin.h> inline void ones(float *a) { __m256 out_aligned = ...

2 la respuesta

¿Cómo escribir código c ++ que el compilador puede compilar eficientemente a SSE o AVX?

Digamos que tengo una función escrita en c ++ que realiza multiplicaciones de vectores de matriz en muchos vectores. Se necesita un puntero a la matriz de vectores para transformar. ¿Estoy en lo cierto al suponer que el compilador no puede ...

2 la respuesta

Generar automáticamente instrucciones de FMA en MSVC

MSVC admite instrucciones AVX / AVX2 desde hace años y de acuerdo conesta publicación de blog de msdn [http://blogs.msdn.com/b/vcblog/archive/2014/02/28/avx2-support-in-visual-studio-c-compiler.aspx] , puede generar ...