Resultados de la búsqueda a petición "sse2"
¿Qué es __m128d?
Realmente no puedo obtener qué "palabra clave" como__m128d está en C ++. Estoy usando MSVC yes [https://docs.microsoft.com/en-us/cpp/cpp/m128d?view=vs-2017] dice:The __m128d data type, for use with the Streaming SIMD Extensions 2 instructions ...
¿La mejor manera de cambiar un __m128i?
Necesito cambiar una variable __m128i, (digamos v), por m bits, de tal manera que los bits se muevan a través de toda la variable (Entonces, la variable resultante representa v * 2 ^ m). ¡¿Cuál es la mejor manera de hacer esto?! Tenga en cuenta ...
Recuento rápido del número de bytes iguales entre dos matrices
Yo escribi la funcion
El código SIMD funciona más lento que el código escalar
elma yelmc son ambosunsigned long matrices Así sonres1 yres2. unsigned long simdstore[2]; __m128i *p, simda, simdb, simdc; p = (__m128i *) simdstore; for (i = 0; i < _polylen; i++) { u1 = (elma[i] >> l) & 15; u2 = (elmc[i] >> l) & 15; for (k = ...
Punto flotante doble extendido (80 bits) en x87, no SSE2: ¿no nos lo perdemos?
Estaba leyendo hoy sobreinvestigadores descubren que las bibliotecas Physidia de NVidia usan x87 FP vs. SSE2 [http://www.zdnet.com/blog/hardware/nvidia-de-optimizes-physx-for-the-cpu/8852?tag=nl.e539] . Obviamente, esto será subóptimo para ...
Instrucción SSE MOVSD (extendido: operaciones escalares y vectoriales de punto flotante en x86, x86-64)
De alguna manera estoy confundido por las instrucciones de montaje MOVSD. Escribí un código numérico que computaba la multiplicación de matrices, simplemente usando el código C ordinario sin intrínsecos SSE. Ni siquiera incluyo el archivo de ...
Multiplicación SSE de 4 enteros de 32 bits.
¿Cómo multiplicar cuatro enteros de 32 bits por otros 4 enteros? No encontré ninguna instrucción que pueda hacerlo.
Página 1 de 2