Resultados de la búsqueda a petición "simd"

2 la respuesta

Borrar bytes superiores de __m128i

3 la respuesta

Compresión de matriz dispersa utilizando SIMD (AVX2)

Tengo una matriz dispersa

2 la respuesta

¿Cuál es la diferencia entre vextracti128 y vextractf128?

1 la respuesta

Implementación del filtro C ++ SSE

Intenté usar SSE para hacer operación de 4 píxeles. Tengo problemas para cargar los datos de la imagen a __m128. Los datos de mi imagen son un búfer de carac...

2 la respuesta

Usando SIMD / AVX / SSE para el recorrido del árbol

Actualmente estoy investigando si sería posible acelerar un recorrido de árboles de van Emde Boas (o de cualquier árbol). Dada una única consulta de búsqueda...

2 la respuesta

Técnicas comunes de SIMD

¿Dónde puedo encontrar información sobre trucos SIMD comunes? Tengo un conjunto de instrucciones y sé cómo escribir código SIMD no complicado, pero sé que SI...

1 la respuesta

Desplazando 4 enteros a la derecha por diferentes valores SIMD

SSE no proporciona una forma de desplazar enteros empaquetados en una cantidad variable (puedo usar cualquier instrucción AVX y anteriores). Solo puedes hacer turnos uniformes. El resultado que estoy tratando de lograr para cada número entero en ...

1 la respuesta

AVX2, ¿Cómo cargar eficientemente cuatro enteros en índices pares de un registro de 256 bits y copiar en índices impares?

Tengo una matriz alineada de enteros en la memoria que contiene los índices I0, I1, I2, I3. Mi objetivo es llevarlos a un registro __m256i que contenga I0, I0 + 1, I1, I1 + 1, I2, I2 + 1, I3, I3 + 1. La parte difícil es llevarlos al registro de ...

1 la respuesta

Alineación y SSE comportamiento extraño

Intento trabajar con SSE y me enfrenté a un comportamiento extraño. Escribo un código simple para comparar dos cadenas con SSE Intrinsics, lo ejecuto y funciona. Pero luego entiendo que en mi código uno de puntero todavía no está alineado, pero ...

1 la respuesta

¿Cómo hacen las instrucciones de Detección de conflictos que facilitan la vectorización de los bucles?

Las familias de instrucciones AVX512CD son: VPCONFLICT, VPLZCNT y VPBROADCASTM. La sección de Wikipedia sobre estas instrucciones [https://en.wikipedia.org/wiki/AVX-512#New_instructions_in_AVX-512_conflict_detection] dice: Las instrucciones en ...