Resultados de la búsqueda a petición "sse"
¿Multiplicación de matriz grande (0,1) usando AND bit a bit y popcount en lugar de multiplicaciones int o float reales?
Para multiplicar matrices binarias grandes (10Kx20K), lo que suelo hacer es convertir las matrices en flotantes y realizar una multiplicación de matriz flotante ya que la multiplicación de matriz entera es bastante lenta (mira ...
memset en paralelo con hilos unidos a cada núcleo físico
He estado probando el código enEn un código paralelo OpenMP, ¿habría algún beneficio para que memset se ejecute en ...
Instrucción SSE MOVSD (extendido: operaciones escalares y vectoriales de punto flotante en x86, x86-64)
De alguna manera estoy confundido por las instrucciones de montaje MOVSD. Escribí un código numérico que computaba la multiplicación de matrices, simplemente usando el código C ordinario sin intrínsecos SSE. Ni siquiera incluyo el archivo de ...
¿Escribir x86 asm funciona de forma portátil (win / linux / osx), sin una construcción dependiente de yasm / nasm?
par2 [https://github.com/Parchive/par2cmdline]tiene una base de código C ++ pequeña y bastante limpia, que creo que funciona bien en GNU / Linux, OS X y Windows (con MSVC ++). Me gustaría incorporar una versión asm x86-64 de la función que ...
Existen versiones SIMD más antiguas disponibles cuando se utilizan las más nuevas?
Cuando puedo usar SSE3 o AVX, ¿están disponibles versiones SSE anteriores como SSE2 o MMX? - ¿o todavía necesito verificarlos por separado?
¿Cómo multiplicar dos cuaterniones con mínimas instrucciones?
Después de pensarlo un poco, se me ocurrió el siguiente código para multiplicar dos cuaterniones usando SSE:
¿Cómo escribir código c ++ que el compilador puede compilar eficientemente a SSE o AVX?
Digamos que tengo una función escrita en c ++ que realiza multiplicaciones de vectores de matriz en muchos vectores. Se necesita un puntero a la matriz de vectores para transformar. ¿Estoy en lo cierto al suponer que el compilador no puede ...
inlining falló en la llamada a always_inline '__m128i _mm_cvtepu8_epi32 (__ m128i)': la opción específica de destino no coincide _mm_cvtepu8_epi32 (__m128i __X) [duplicado]
Esta pregunta ya tiene una respuesta aquí: inlining falló en la llamada a always_inline ‘_mm_mullo_epi32’: la opción específica de destino no ...
Desplazando 4 enteros a la derecha por diferentes valores SIMD
SSE no proporciona una forma de desplazar enteros empaquetados en una cantidad variable (puedo usar cualquier instrucción AVX y anteriores). Solo puedes hacer turnos uniformes. El resultado que estoy tratando de lograr para cada número entero en ...