Resultados de la búsqueda a petición "avx2"

2 la respuesta

¿Cuál es la versión mínima de OS X para usar con AVX / AVX2?

Tengo una rutina de dibujo de imágenes que se compila varias veces para SSE, SSE2, SSE3, SSE4.1, SSE4.2, AVX y AVX2. Mi programa despacha dinámicamente una de estas variaciones binarias al verificar los indicadores de CPUID. En Windows, verifico ...

2 la respuesta

Intrínsecos de dispersión en AVX

2 la respuesta

¿Cuál es la secuencia de instrucciones de recopilación stride-3 más rápida?

La pregunta:¿Cuál es la secuencia más eficiente para generar una reunión stride-3 de elementos de 32 bits de la memoria? Si la memoria está organizada como: MEM = R0 G0 B0 R1 G1 B1 R2 G2 B2 R3 G3 B3 ...Queremos obtener tres registros ...

1 la respuesta

AVX2, ¿Cómo cargar eficientemente cuatro enteros en índices pares de un registro de 256 bits y copiar en índices impares?

Tengo una matriz alineada de enteros en la memoria que contiene los índices I0, I1, I2, I3. Mi objetivo es llevarlos a un registro __m256i que contenga I0, I0 + 1, I1, I1 + 1, I2, I2 + 1, I3, I3 + 1. La parte difícil es llevarlos al registro de ...

1 la respuesta

Comparación de vectorización automática

Tengo problemas para que mi g ++ 5.4 use vectorización para comparar. Básicamente quiero comparar 4 entradas sin signo usando vectorización. Mi primer enfoque fue directo: bool compare(unsigned int const pX[4]) { bool c1 = (temp[0] < 1); bool c2 ...

2 la respuesta

¿Cuál es la diferencia entre vextracti128 y vextractf128?

2 la respuesta

Acceso a la memoria alineado y no alineado con intrínsecos AVX / AVX2

De acuerdo con el Manual del desarrollador de software de Intel (sección 14.9), AVX relajó los requisitos de alineación de los accesos a la memoria. Si los datos se cargan directamente en una instrucción de procesamiento, p. vaddps ...

1 la respuesta

Implementación alternativa para la detección de conflictos en AVX2

AVX512CD contiene el intrínseco_mm512_conflict_epi32(__m512i a) devuelve un vector donde para cada elemento ena se establece un bit si tiene el mismo valor. ¿Hay alguna manera de hacer algo similar en AVX2? No estoy interesado en los bits ...

2 la respuesta

selectivamente elementos de una lista con instrucciones AVX2

Quiero acelerar la siguiente operación con las instrucciones de AVX2, pero no pude encontrar una manera de hacerlo. Me dan una gran variedaduint64_t data[100000] de uint64_t's, y una matrizunsigned char indices[100000] de bytes. Quiero generar ...

3 la respuesta

Compresión de matriz dispersa utilizando SIMD (AVX2)

Tengo una matriz dispersa