Álgebra lineal paralela para sistemas multinúcleo

Estoy desarrollando un programa que necesita hacer cálculos pesados ​​de álgebra lineal.

Ahora estoy usandoLAPACK / BLAS Rutinas, pero necesito explotar mi máquina (24 core Xeon X5690).

He encontrado proyectos comopblas yScalapack, pero todos parecen enfocarse en la computación distribuida y en usar MPI.

No tengo un clúster disponible, todos los cálculos se realizarán en un solo servidor y el uso de MPI parece una exageración.

¿Alguien tiene alguna sugerencia sobre esto?

Respuestas a la pregunta(2)

Su respuesta a la pregunta