Álgebra linear paralela para sistema multicore
Estou desenvolvendo um programa que precisa fazer cálculos pesados de álgebra linear.
Agora estou usandoLAPACK / BLAS rotinas, mas eu preciso explorar a minha máquina (24 core Xeon X5690).
Eu encontrei projetos comopblas eescalpack, mas todos parecem se concentrar na computação distribuída e no uso de MPI.
Eu não tenho nenhum cluster disponível, todos os cálculos serão feitos em um único servidor e usar o MPI parece um exagero.
Alguém tem alguma sugestão sobre isso?