Resultados de la búsqueda a petición "sse"
¿Las variables SSE / AVX locales estáticas / estáticas bloquean un registro xmm / ymm?
Cuando se usan intrínsecos SSE, a menudo se requieren cero vectores. Una forma de evitar crear una variable cero dentro de una función cada vez que se llama a la función (cada vez que se llama efectivamente alguna instrucción de vector xor) sería ...
Prueba de igualdad entre dos variables __m128i
Si quiero hacer una prueba de igualdad bit a bit entre dos__m128i variables, ¿debo usar una instrucción SSE o puedo usar==? Si no, ¿qué instrucción SSE debo usar?
¿Se puede construir una función hash "buena" usando CRC32C como base?
Dado que SSE 4.2 (partes Intel Core i7 e i5) incluye una instrucción CRC32, parece razonable investigar si uno podría construir una función hash de propósito general más rápida. De acuerdo aesta [http://home.comcast.net/~bretm/hash/8.html]solo 16 ...
numpy alrededor / rint lento en comparación con el tipo (int)
Entonces si tengo algo comox=np.random.rand(60000)*400-200. iPython%timeit dice: x.astype(int) toma 0.14msnp.rint(x) ynp.around(x) tomar 1.01msTenga en cuenta que en elrint yaround casos, aún necesita gastar 0.14ms adicionales para hacer una ...
¿Es posible el práctico BigNum AVX / SSE?
Los registros SSE / AVX pueden verse como números enteros o de coma flotante BigNums. Es decir, uno podría descuidar que existen carriles en absoluto. ¿Existe una manera fácil de explotar este punto de vista y usar estos registros como BigNums, ...
¿Cuál es la diferencia entre los intrínsecos lógicos de SSE?
¿Hay alguna diferencia entre las intrínsecas lógicas de SSE para diferentes tipos? Por ejemplo, si tomamos la operación OR, hay tres intrínsecos: _mm_or_ps, _mm_or_pd y _mm_or_si128, todos los cuales hacen lo mismo: calcularbit a bit O de sus ...
¿Cómo usar correctamente las instrucciones de captación previa?
Estoy tratando de vectorizar un bucle, calculando el producto de puntos de un gran flotante de vectores. Lo estoy calculando en paralelo, utilizando el hecho de que la CPU tiene una gran cantidad de registros XMM, como este: __m128* A, B; __m128 ...
c ++ SSE SIMD framework [cerrado]
¿Alguien conoce una biblioteca de intrínsecos SIMD C ++ x86 de código abierto? Intel proporciona exactamente lo que necesito en su biblioteca integrada de primitivas de rendimiento, pero no puedo usar eso debido a los derechos de autor en todo ...
SIMD firmado con multiplicación sin signo para 64 bits * 64 bits a 128 bits
He creado una función que hace de 64 bits * 64 bits a 128 bits usando SIMD. Actualmente lo he implementado usando SSE2 (agudamente SSE4.1). Esto significa que hace dos productos de 64b * 64b a 128b al mismo tiempo. La misma idea podría extenderse ...
Comprobando si SSE es compatible en tiempo de ejecución [duplicado]
Esta pregunta ya tiene una respuesta aquí: ¿Cómo verificar si una CPU admite el conjunto de instrucciones SSE3? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 respuestasdespachador de CPU para Visual Studio para ...