El parfor de MATLAB es más lento que para - ¿qué está mal?

el código con el que estoy tratando tiene bucles como el siguiente:

bistar = zeros(numdims,numcases); 
parfor hh=1:nt       
  bistar = bistar +  A(:,:,hh)*data(:,:,hh+1)' ;
end   

para nt pequeño (10).

Después de cronometrarlo, en realidad es100 veces más lento que usar el bucle regular !!! Sé que Parfor puede hacer sumas paralelas, por lo que no estoy seguro de por qué esto no funciona.

Corro

matlabpool

con las configuraciones listas para usar antes de ejecutar mi código.

Soy relativamente nuevo en matlab y acabo de comenzar a usar las funciones paralelas, así que no asumas que no estoy haciendo algo estúpido.

¡Gracias!

PD: estoy ejecutando el código en un núcleo cuádruple, por lo que esperaría ver algunas mejoras.

Respuestas a la pregunta(3)

Su respuesta a la pregunta