Gradient-Descent-Implementierung in Oktaven

Ich kämpfe jetzt schon seit 2 Monaten dagegen an. Was macht diese anders?

hypotheses= X * theta
temp=(hypotheses-y)'
temp=X(:,1) * temp
temp=temp * (1 / m)
temp=temp * alpha
theta(1)=theta(1)-temp

hypotheses= X * theta
temp=(hypotheses-y)'
temp=temp * (1 / m)
temp=temp * alpha
theta(2)=theta(2)-temp



theta(1) = theta(1) - alpha * (1/m) * ((X * theta) - y)' * X(:, 1);
theta(2) = theta(2) - alpha * (1/m) * ((X * theta) - y)' * X(:, 2);

Letzteres funktioniert. Ich bin mir nur nicht sicher, warum ... Ich habe Mühe, die Notwendigkeit der inversen Matrix zu verstehen.

Antworten auf die Frage(6)

Ihre Antwort auf die Frage