Parallele lineare Algebra für Multicore-System

Ich entwickle ein Programm, das schwere lineare Algebra-Berechnungen durchführen muss.

Jetzt benutze ichLAPACK / BLAS Routinen, aber ich muss meine Maschine ausnutzen (24-Kern-Xeon X5690).

Ich habe Projekte wie gefundenpblas undKopfpackungSie scheinen sich alle auf verteiltes Rechnen und die Verwendung von MPI zu konzentrieren.

Ich habe keinen Cluster zur Verfügung, alle Berechnungen werden auf einem einzelnen Server durchgeführt und die Verwendung von MPI sieht aus wie ein Overkill.

Hat jemand einen Vorschlag dazu?

Antworten auf die Frage(2)

Ihre Antwort auf die Frage