Wirkung von --oaa 2 und --loss_function = logistic in Vowpal Wabbit

Welche Parameter sollte ich in VW für eine Binärklassifizierungsaufgabe verwenden? Zum Beispiel verwenden wirrcv1_small.dat. ichhabe gedacht es ist besser, die logistische Verlustfunktion (oder das Scharnier) zu verwenden, und es macht keinen Sinn, sie zu verwenden--oaa 2. Die empirischen Ergebnisse (mit progressiver Validierung 0/1 Verlust in allen 4 Experimenten) zeigen jedoch, dass die beste Kombination ist--oaa 2 ohne logistischen Verlust (d. h. mit dem Standardquadratverlust):

cd vowpal_wabbit/test/train-sets

cat rcv1_small.dat | vw --binary
# average loss = 0.0861

cat rcv1_small.dat | vw --binary --loss_function=logistic
# average loss = 0.0909

cat rcv1_small.dat | sed 's/^-1/2/' | vw --oaa 2
# average loss = 0.0857

cat rcv1_small.dat | sed 's/^-1/2/' | vw --oaa 2 --loss_function=logistic
# average loss = 0.0934

Meine Hauptfrage ist:Warum--oaa 2 liefert nicht genau die gleichen Ergebnisse wie--binary (in der obigen Einstellung)?

Meine sekundären Fragen sind: Warum verbessert die Optimierung des logistischen Verlusts den 0/1-Verlust nicht (im Vergleich zur Optimierung des Standardquadratverlusts)? Handelt es sich um einen bestimmten Datensatz?

Antworten auf die Frage(1)

Ihre Antwort auf die Frage