Resultados de la búsqueda a petición "simd"
Compresión de matriz dispersa utilizando SIMD (AVX2)
Tengo una matriz dispersa
Implementación del filtro C ++ SSE
Intenté usar SSE para hacer operación de 4 píxeles. Tengo problemas para cargar los datos de la imagen a __m128. Los datos de mi imagen son un búfer de carac...
Usando SIMD / AVX / SSE para el recorrido del árbol
Actualmente estoy investigando si sería posible acelerar un recorrido de árboles de van Emde Boas (o de cualquier árbol). Dada una única consulta de búsqueda...
Técnicas comunes de SIMD
¿Dónde puedo encontrar información sobre trucos SIMD comunes? Tengo un conjunto de instrucciones y sé cómo escribir código SIMD no complicado, pero sé que SI...
Desplazando 4 enteros a la derecha por diferentes valores SIMD
SSE no proporciona una forma de desplazar enteros empaquetados en una cantidad variable (puedo usar cualquier instrucción AVX y anteriores). Solo puedes hacer turnos uniformes. El resultado que estoy tratando de lograr para cada número entero en ...
AVX2, ¿Cómo cargar eficientemente cuatro enteros en índices pares de un registro de 256 bits y copiar en índices impares?
Tengo una matriz alineada de enteros en la memoria que contiene los índices I0, I1, I2, I3. Mi objetivo es llevarlos a un registro __m256i que contenga I0, I0 + 1, I1, I1 + 1, I2, I2 + 1, I3, I3 + 1. La parte difícil es llevarlos al registro de ...
Alineación y SSE comportamiento extraño
Intento trabajar con SSE y me enfrenté a un comportamiento extraño. Escribo un código simple para comparar dos cadenas con SSE Intrinsics, lo ejecuto y funciona. Pero luego entiendo que en mi código uno de puntero todavía no está alineado, pero ...
¿Cómo hacen las instrucciones de Detección de conflictos que facilitan la vectorización de los bucles?
Las familias de instrucciones AVX512CD son: VPCONFLICT, VPLZCNT y VPBROADCASTM. La sección de Wikipedia sobre estas instrucciones [https://en.wikipedia.org/wiki/AVX-512#New_instructions_in_AVX-512_conflict_detection] dice: Las instrucciones en ...