Resultados de la búsqueda a petición "simd"
¿Cómo acelerar este histograma de búsquedas LUT?
Primero, tengo una matrizint a[1000][1000]. Todos estos enteros están entre 0 y 32767, y son constantes conocidas: nunca cambian durante una ejecución del programa. Segundo, tengo una matriz b [32768], que contiene enteros entre 0 y 32. ...
Existen versiones SIMD más antiguas disponibles cuando se utilizan las más nuevas?
Cuando puedo usar SSE3 o AVX, ¿están disponibles versiones SSE anteriores como SSE2 o MMX? - ¿o todavía necesito verificarlos por separado?
Cómo carga / almacena desde / a una matriz de dobles con GNU C Vector Extensions?
Estoy usandoGNU C Extensiones de vectores [https://gcc.gnu.org/onlinedocs/gcc/Vector-Extensions.html], no Intel's_mm_* intrínsecos. Quiero hacer lo mismo que Intel's_m256_loadu_pd intrínseco. Asignar los valores uno por uno es lento: gcc ...
_mm_testc_ps y _mm_testc_pd vs _mm_testc_si128
Como saben, los dos primeros son intrínsecos específicos de AVX y el segundo es un intrínseco SSE4.1. Ambos conjuntos de intrínsecos se pueden usar para verificar la igualdad de 2 vectores de punto flotante. Mi caso de uso ...
¿Por qué Intel anuncia algunas latencias AVX de Haswell como 3 veces más lentas que Sandy Bridge?
En el Intelintrinsics ...
¿Cómo puedo usar las instrucciones SVML [duplicar]
Esta pregunta ya tiene una respuesta aquí: Error de C ++: "_mm_sin_ps" no se declaró en este ámbito [/questions/31978592/c-error-mm-sin-ps-was-not-declared-in-this-scope] 3 respuestas ¿Dónde está intrínseco '_mm256_pow_ps' de ...
selectivamente elementos de una lista con instrucciones AVX2
Quiero acelerar la siguiente operación con las instrucciones de AVX2, pero no pude encontrar una manera de hacerlo. Me dan una gran variedaduint64_t data[100000] de uint64_t's, y una matrizunsigned char indices[100000] de bytes. Quiero generar ...
Cargar un xmm desde GP regs
Digamos que tiene valores enrax yrdx desea cargar en unaxmm registrarse. Una forma sería: movq xmm0, rax pinsrq xmm0, rdx, 1 ¡Aunque es bastante lento! ¿Hay una mejor manera?
Constexpr y SSE intrínsecos
os compiladores @Most C ++ admiten instrucciones SIMD (SSE / AVX) con elementos intrínsecos como _mm_cmpeq_epi32Mi problema con esto es que esta función no está marcada comoconstexpr, aunque "semánticamente" no hay razón para que esta función ...
Cómo convertir eficientemente un mapa de bits de 8 bits a una matriz de enteros 0/1 con x86 SIMD
Quiero convertir un entero de 8 bits en una matriz de tamaño 8 con cada valor que contenga el valor de bit de un entero. Por ejemplo: tengoint8_t x = 8; Quiero convertir esto aint8_t array_x = {0,0,0,0,1,0,0,0}; Esto tiene que hacerse de ...