Resultados de la búsqueda a petición "simd"

2 la respuesta

Agregar horizontal con __m512 (AVX512)

¿Cómo se realiza eficientemente la adición horizontal con flotantes en un registro AVX de 512 bits (es decir, se suman los elementos de un solo vector)? Para registros de 128 y 256 bits, esto se puede hacer usando _mm_hadd_ps y _mm256_hadd_ps ...

3 la respuesta

Prueba de igualdad entre dos variables __m128i

Si quiero hacer una prueba de igualdad bit a bit entre dos__m128i variables, ¿debo usar una instrucción SSE o puedo usar==? Si no, ¿qué instrucción SSE debo usar?

2 la respuesta

CPU SIMD vs GPU SIMD?

GPU usa elSIMD [http://en.wikipedia.org/wiki/SIMD]paradigma, es decir, la misma porción de código se ejecutará en paralelo y se aplicará a varios elementos de un conjunto de datos. Sin embargo, la CPU también usa SIMD y proporciona paralelismo a ...

2 la respuesta

Recuento de población de 64 bits más rápido (peso de Hamming)

Tuve que calcular el peso de Hamming para un flujo continuo bastante rápido de datos de 64 bits y usar elpopcnt Las instrucciones de ensamblaje me arrojan una excepción en mi Intel Core i7-4650U. Revisé el deleite de mi biblia Hacker y escaneé ...

3 la respuesta

¿Es posible el práctico BigNum AVX / SSE?

Los registros SSE / AVX pueden verse como números enteros o de coma flotante BigNums. Es decir, uno podría descuidar que existen carriles en absoluto. ¿Existe una manera fácil de explotar este punto de vista y usar estos registros como BigNums, ...

3 la respuesta

¿Cuál es la diferencia entre los intrínsecos lógicos de SSE?

¿Hay alguna diferencia entre las intrínsecas lógicas de SSE para diferentes tipos? Por ejemplo, si tomamos la operación OR, hay tres intrínsecos: _mm_or_ps, _mm_or_pd y _mm_or_si128, todos los cuales hacen lo mismo: calcularbit a bit O de sus ...

1 la respuesta

¿Todas las arquitecturas Intel de 64 bits son compatibles con las instrucciones SSSE3 / SSE4.1 / SSE4.2?

Hice búsquedas en la web ymanual de software de Intel [http://www.intel.com/Assets/ja_JP/PDF/manual/253665.pdf]. Pero no puedo confirmar si todas las arquitecturas Intel 64 admiten hasta SSSE3 o hasta SSE4.1 o hasta SSE4.2 o AVX, etc. Para poder ...

5 la respuesta

¿Cómo verificar si el código compilado usa instrucciones sse y avx?

Escribí un código para hacer un montón de matemáticas, y tiene que ir rápido, así que necesito que use las instrucciones SSE y AVX. Lo estoy compilando con g ++ y estoy usando las banderas-O3 y-march=native, así que creo que está ...

8 la respuesta

c ++ SSE SIMD framework [cerrado]

¿Alguien conoce una biblioteca de intrínsecos SIMD C ++ x86 de código abierto? Intel proporciona exactamente lo que necesito en su biblioteca integrada de primitivas de rendimiento, pero no puedo usar eso debido a los derechos de autor en todo ...

3 la respuesta

Mapa de bits uint8_t óptimo en un vector "bool" SIMD de 8 x 32 bits

Como parte de un algoritmo de compresión, estoy buscando la forma óptima de lograr lo siguiente: Tengo un mapa de bits simple en unuint8_t. Por ejemplo 01010011 Lo que quiero es un__m256i de la forma: (0, maxint, 0, maxint, 0, 0, ...