Resultados de la búsqueda a petición "sse"

1 la respuesta

¿Multiplicación de matriz grande (0,1) usando AND bit a bit y popcount en lugar de multiplicaciones int o float reales?

Para multiplicar matrices binarias grandes (10Kx20K), lo que suelo hacer es convertir las matrices en flotantes y realizar una multiplicación de matriz flotante ya que la multiplicación de matriz entera es bastante lenta (mira ...

1 la respuesta

memset en paralelo con hilos unidos a cada núcleo físico

He estado probando el código enEn un código paralelo OpenMP, ¿habría algún beneficio para que memset se ejecute en ...

1 la respuesta

Instrucción SSE MOVSD (extendido: operaciones escalares y vectoriales de punto flotante en x86, x86-64)

De alguna manera estoy confundido por las instrucciones de montaje MOVSD. Escribí un código numérico que computaba la multiplicación de matrices, simplemente usando el código C ordinario sin intrínsecos SSE. Ni siquiera incluyo el archivo de ...

1 la respuesta

¿Escribir x86 asm funciona de forma portátil (win / linux / osx), sin una construcción dependiente de yasm / nasm?

par2 [https://github.com/Parchive/par2cmdline]tiene una base de código C ++ pequeña y bastante limpia, que creo que funciona bien en GNU / Linux, OS X y Windows (con MSVC ++). Me gustaría incorporar una versión asm x86-64 de la función que ...

3 la respuesta

Existen versiones SIMD más antiguas disponibles cuando se utilizan las más nuevas?

Cuando puedo usar SSE3 o AVX, ¿están disponibles versiones SSE anteriores como SSE2 o MMX? - ¿o todavía necesito verificarlos por separado?

2 la respuesta

¿Cómo multiplicar dos cuaterniones con mínimas instrucciones?

Después de pensarlo un poco, se me ocurrió el siguiente código para multiplicar dos cuaterniones usando SSE:

2 la respuesta

¿Cómo escribir código c ++ que el compilador puede compilar eficientemente a SSE o AVX?

Digamos que tengo una función escrita en c ++ que realiza multiplicaciones de vectores de matriz en muchos vectores. Se necesita un puntero a la matriz de vectores para transformar. ¿Estoy en lo cierto al suponer que el compilador no puede ...

3 la respuesta

Detectar la disponibilidad del conjunto de instrucciones SSE / SSE2 en Visual Studio

1 la respuesta

inlining falló en la llamada a always_inline '__m128i _mm_cvtepu8_epi32 (__ m128i)': la opción específica de destino no coincide _mm_cvtepu8_epi32 (__m128i __X) [duplicado]

Esta pregunta ya tiene una respuesta aquí: inlining falló en la llamada a always_inline ‘_mm_mullo_epi32’: la opción específica de destino no ...

1 la respuesta

Desplazando 4 enteros a la derecha por diferentes valores SIMD

SSE no proporciona una forma de desplazar enteros empaquetados en una cantidad variable (puedo usar cualquier instrucción AVX y anteriores). Solo puedes hacer turnos uniformes. El resultado que estoy tratando de lograr para cada número entero en ...