Resultados de la búsqueda a petición "simd"

Primero, tengo una matrizint a[1000][1000]. Todos estos enteros están entre 0 y 32767, y son constantes conocidas: nunca cambian durante una ejecución del programa. Segundo, tengo una matriz b [32768], que contiene enteros entre 0 y 32. ...

c avx c++sse

3 la respuesta

Existen versiones SIMD más antiguas disponibles cuando se utilizan las más nuevas?

Cuando puedo usar SSE3 o AVX, ¿están disponibles versiones SSE anteriores como SSE2 o MMX? - ¿o todavía necesito verificarlos por separado?

gcc x86 c vectorization

3 la respuesta

Cómo carga / almacena desde / a una matriz de dobles con GNU C Vector Extensions?

Estoy usandoGNU C Extensiones de vectores [https://gcc.gnu.org/onlinedocs/gcc/Vector-Extensions.html], no Intel's_mm_* intrínsecos. Quiero hacer lo mismo que Intel's_m256_loadu_pd intrínseco. Asignar los valores uno por uno es lento: gcc ...

c x86 avx sse4

1 la respuesta

_mm_testc_ps y _mm_testc_pd vs _mm_testc_si128

Como saben, los dos primeros son intrínsecos específicos de AVX y el segundo es un intrínseco SSE4.1. Ambos conjuntos de intrínsecos se pueden usar para verificar la igualdad de 2 vectores de punto flotante. Mi caso de uso ...

x86-64 avx2 intel cpu-architecture

1 la respuesta

¿Por qué Intel anuncia algunas latencias AVX de Haswell como 3 veces más lentas que Sandy Bridge?

En el Intelintrinsics ...

c++x86 sse

1 la respuesta

¿Cómo puedo usar las instrucciones SVML [duplicar]

Esta pregunta ya tiene una respuesta aquí: Error de C ++: "_mm_sin_ps" no se declaró en este ámbito [/questions/31978592/c-error-mm-sin-ps-was-not-declared-in-this-scope] 3 respuestas ¿Dónde está intrínseco '_mm256_pow_ps' de ...

optimization avx avx2 x86

2 la respuesta

selectivamente elementos de una lista con instrucciones AVX2

Quiero acelerar la siguiente operación con las instrucciones de AVX2, pero no pude encontrar una manera de hacerlo. Me dan una gran variedaduint64_t data[100000] de uint64_t's, y una matrizunsigned char indices[100000] de bytes. Quiero generar ...

assembly x86 sse micro-optimization

1 la respuesta

Cargar un xmm desde GP regs

Digamos que tiene valores enrax yrdx desea cargar en unaxmm registrarse. Una forma sería: movq xmm0, rax pinsrq xmm0, rdx, 1 ¡Aunque es bastante lento! ¿Hay una mejor manera?

intrinsics sse c++constexpr

1 la respuesta

Constexpr y SSE intrínsecos

os compiladores @Most C ++ admiten instrucciones SIMD (SSE / AVX) con elementos intrínsecos como _mm_cmpeq_epi32Mi problema con esto es que esta función no está marcada comoconstexpr, aunque "semánticamente" no hay razón para que esta función ...

bit-manipulation x86 sse avx2

2 la respuesta

Cómo convertir eficientemente un mapa de bits de 8 bits a una matriz de enteros 0/1 con x86 SIMD

Quiero convertir un entero de 8 bits en una matriz de tamaño 8 con cada valor que contenga el valor de bit de un entero. Por ejemplo: tengoint8_t x = 8; Quiero convertir esto aint8_t array_x = {0,0,0,0,1,0,0,0}; Esto tiene que hacerse de ...

Página 9 de 11

7 8910 11

Resultados de la búsqueda a petición "simd"

¿Cómo acelerar este histograma de búsquedas LUT?

Existen versiones SIMD más antiguas disponibles cuando se utilizan las más nuevas?

Cómo carga / almacena desde / a una matriz de dobles con GNU C Vector Extensions?

Etiquetas Populares

_mm_testc_ps y _mm_testc_pd vs _mm_testc_si128

¿Por qué Intel anuncia algunas latencias AVX de Haswell como 3 veces más lentas que Sandy Bridge?

¿Cómo puedo usar las instrucciones SVML [duplicar]

selectivamente elementos de una lista con instrucciones AVX2

Cargar un xmm desde GP regs

Constexpr y SSE intrínsecos

Cómo convertir eficientemente un mapa de bits de 8 bits a una matriz de enteros 0/1 con x86 SIMD

¡Eres muy activo! ¡Es genial!

Resultados de la búsqueda a petición "simd"

Etiquetas Populares