Resultados de la búsqueda a petición "simd"

1 la respuesta

¿Cómo acelerar este histograma de búsquedas LUT?

Primero, tengo una matrizint a[1000][1000]. Todos estos enteros están entre 0 y 32767, y son constantes conocidas: nunca cambian durante una ejecución del programa. Segundo, tengo una matriz b [32768], que contiene enteros entre 0 y 32. ...

3 la respuesta

Existen versiones SIMD más antiguas disponibles cuando se utilizan las más nuevas?

Cuando puedo usar SSE3 o AVX, ¿están disponibles versiones SSE anteriores como SSE2 o MMX? - ¿o todavía necesito verificarlos por separado?

3 la respuesta

Cómo carga / almacena desde / a una matriz de dobles con GNU C Vector Extensions?

Estoy usandoGNU C Extensiones de vectores [https://gcc.gnu.org/onlinedocs/gcc/Vector-Extensions.html], no Intel's_mm_* intrínsecos. Quiero hacer lo mismo que Intel's_m256_loadu_pd intrínseco. Asignar los valores uno por uno es lento: gcc ...

1 la respuesta

_mm_testc_ps y _mm_testc_pd vs _mm_testc_si128

Como saben, los dos primeros son intrínsecos específicos de AVX y el segundo es un intrínseco SSE4.1. Ambos conjuntos de intrínsecos se pueden usar para verificar la igualdad de 2 vectores de punto flotante. Mi caso de uso ...

1 la respuesta

¿Por qué Intel anuncia algunas latencias AVX de Haswell como 3 veces más lentas que Sandy Bridge?

En el Intelintrinsics ...

1 la respuesta

¿Cómo puedo usar las instrucciones SVML [duplicar]

Esta pregunta ya tiene una respuesta aquí: Error de C ++: "_mm_sin_ps" no se declaró en este ámbito [/questions/31978592/c-error-mm-sin-ps-was-not-declared-in-this-scope] 3 respuestas ¿Dónde está intrínseco '_mm256_pow_ps' de ...

2 la respuesta

selectivamente elementos de una lista con instrucciones AVX2

Quiero acelerar la siguiente operación con las instrucciones de AVX2, pero no pude encontrar una manera de hacerlo. Me dan una gran variedaduint64_t data[100000] de uint64_t's, y una matrizunsigned char indices[100000] de bytes. Quiero generar ...

1 la respuesta

Cargar un xmm desde GP regs

Digamos que tiene valores enrax yrdx desea cargar en unaxmm registrarse. Una forma sería: movq xmm0, rax pinsrq xmm0, rdx, 1 ¡Aunque es bastante lento! ¿Hay una mejor manera?

1 la respuesta

Constexpr y SSE intrínsecos

os compiladores @Most C ++ admiten instrucciones SIMD (SSE / AVX) con elementos intrínsecos como _mm_cmpeq_epi32Mi problema con esto es que esta función no está marcada comoconstexpr, aunque "semánticamente" no hay razón para que esta función ...

2 la respuesta

Cómo convertir eficientemente un mapa de bits de 8 bits a una matriz de enteros 0/1 con x86 SIMD

Quiero convertir un entero de 8 bits en una matriz de tamaño 8 con cada valor que contenga el valor de bit de un entero. Por ejemplo: tengoint8_t x = 8; Quiero convertir esto aint8_t array_x = {0,0,0,0,1,0,0,0}; Esto tiene que hacerse de ...