Resultados de la búsqueda a petición "avx2"
¿La forma más rápida de multiplicar una matriz de int64_t?
Quiero vectorizar la multiplicación de dos matrices alineadas en memoria. No encontré ninguna forma de multiplicar 64 * 64 bits en AVX / AVX2, así que simplemente hice un loop-roll y AVX2 cargas / tiendas. ¿Hay una forma más rápida de hacer ...
¿Por qué Intel anuncia algunas latencias AVX de Haswell como 3 veces más lentas que Sandy Bridge?
En el Intelintrinsics ...
¿hay una instrucción inversa a la instrucción movemask en intel avx2?
Las instrucciones de máscara de movimiento toman un __m256i y devuelven un int32 donde cada bit (ya sea los primeros 4, 8 o los 32 bits dependiendo del tipo de elemento del vector de entrada) es el bit más significativo del elemento vectorial ...
selectivamente elementos de una lista con instrucciones AVX2
Quiero acelerar la siguiente operación con las instrucciones de AVX2, pero no pude encontrar una manera de hacerlo. Me dan una gran variedaduint64_t data[100000] de uint64_t's, y una matrizunsigned char indices[100000] de bytes. Quiero generar ...
l informe @perf muestra esta función "__memset_avx2_unaligned_erms" tiene sobrecarga. ¿Significa esto que la memoria no está alineada?
Estoy tratando de perfilar mi código C ++ usando la herramienta perf. La implementación contiene código con instrucciones SSE / AVX / AVX2. Además de que el código se compila con-O3 -mavx2 -march=native banderas. ...
Cómo convertir eficientemente un mapa de bits de 8 bits a una matriz de enteros 0/1 con x86 SIMD
Quiero convertir un entero de 8 bits en una matriz de tamaño 8 con cada valor que contenga el valor de bit de un entero. Por ejemplo: tengoint8_t x = 8; Quiero convertir esto aint8_t array_x = {0,0,0,0,1,0,0,0}; Esto tiene que hacerse de ...