Реализация градиентного спуска в октаве

Я на самом деле боролся с этим вот уже как 2 месяца. Что отличает их?

hypotheses= X * theta
temp=(hypotheses-y)'
temp=X(:,1) * temp
temp=temp * (1 / m)
temp=temp * alpha
theta(1)=theta(1)-temp

hypotheses= X * theta
temp=(hypotheses-y)'
temp=temp * (1 / m)
temp=temp * alpha
theta(2)=theta(2)-temp



theta(1) = theta(1) - alpha * (1/m) * ((X * theta) - y)' * X(:, 1);
theta(2) = theta(2) - alpha * (1/m) * ((X * theta) - y)' * X(:, 2);

Последний работает. Я просто не знаю, почему ... Я изо всех сил пытаюсь понять необходимость обратной матрицы.

Ответы на вопрос(6)

Ваш ответ на вопрос