ie Vorhersagemethode @xgboost gibt für alle Zeilen den gleichen Vorhersagewert zurück.

Ich habe in Python einen xgboost-Klassifikator erstellt:

train ist ein Pandas-Datenrahmen mit 100.000 Zeilen und 50 Features als Spalten. Ziel ist eine Pandas-Serie

xgb_classifier = xgb.XGBClassifier(nthread=-1, max_depth=3, silent=0, 
                                   objective='reg:linear', n_estimators=100)
xgb_classifier = xgb_classifier.fit(train, target)

predictions = xgb_classifier.predict(test)

Nach dem Training, wenn ich diesen Klassifikator verwende, um Werte vorherzusagen, ist das gesamte Ergebnisarray dieselbe Zahl. Irgendeine Idee, warum das passieren würde?

Datenklärung: ~ 50 numerische Merkmale mit einem numerischen Ziel

Ich habe auch RandomForest Regression von sklearn mit denselben Daten ausprobiert und es gibt realistische Vorhersagen. Vielleicht ein legitimer Fehler in der xgboost-Implementierung?

Antworten auf die Frage(10)

Ihre Antwort auf die Frage