Implementação de descida de gradiente em oitava

Eu realmente tenho lutado contra isso por uns 2 meses agora. O que é que faz isso diferente?

hypotheses= X * theta
temp=(hypotheses-y)'
temp=X(:,1) * temp
temp=temp * (1 / m)
temp=temp * alpha
theta(1)=theta(1)-temp

hypotheses= X * theta
temp=(hypotheses-y)'
temp=temp * (1 / m)
temp=temp * alpha
theta(2)=theta(2)-temp



theta(1) = theta(1) - alpha * (1/m) * ((X * theta) - y)' * X(:, 1);
theta(2) = theta(2) - alpha * (1/m) * ((X * theta) - y)' * X(:, 2);

Este último funciona. Eu só não tenho certeza por que ... Eu luto para entender a necessidade do inverso da matriz.

questionAnswers(6)

yourAnswerToTheQuestion