ie Vorhersagemethode @xgboost gibt für alle Zeilen den gleichen Vorhersagewert zurück.
Ich habe in Python einen xgboost-Klassifikator erstellt:
train ist ein Pandas-Datenrahmen mit 100.000 Zeilen und 50 Features als Spalten. Ziel ist eine Pandas-Serie
xgb_classifier = xgb.XGBClassifier(nthread=-1, max_depth=3, silent=0,
objective='reg:linear', n_estimators=100)
xgb_classifier = xgb_classifier.fit(train, target)
predictions = xgb_classifier.predict(test)
Nach dem Training, wenn ich diesen Klassifikator verwende, um Werte vorherzusagen, ist das gesamte Ergebnisarray dieselbe Zahl. Irgendeine Idee, warum das passieren würde?
Datenklärung: ~ 50 numerische Merkmale mit einem numerischen Ziel
Ich habe auch RandomForest Regression von sklearn mit denselben Daten ausprobiert und es gibt realistische Vorhersagen. Vielleicht ein legitimer Fehler in der xgboost-Implementierung?