Implementacja Gradient Descent w oktawie

Właściwie walczyłem z tym od 2 miesięcy. Co sprawia, że ​​są różne?

hypotheses= X * theta
temp=(hypotheses-y)'
temp=X(:,1) * temp
temp=temp * (1 / m)
temp=temp * alpha
theta(1)=theta(1)-temp

hypotheses= X * theta
temp=(hypotheses-y)'
temp=temp * (1 / m)
temp=temp * alpha
theta(2)=theta(2)-temp



theta(1) = theta(1) - alpha * (1/m) * ((X * theta) - y)' * X(:, 1);
theta(2) = theta(2) - alpha * (1/m) * ((X * theta) - y)' * X(:, 2);

Ten ostatni działa. Po prostu nie jestem pewien, dlaczego ... Staram się zrozumieć potrzebę odwrotnej macierzy.

questionAnswers(6)

yourAnswerToTheQuestion