El método de predicción xgboost devuelve el mismo valor pronosticado para todas las filas
He creado un clasificador xgboost en Python:
train es un marco de datos de pandas con 100k filas y 50 características como columnas. el objetivo es una serie de pandas
xgb_classifier = xgb.XGBClassifier(nthread=-1, max_depth=3, silent=0,
objective='reg:linear', n_estimators=100)
xgb_classifier = xgb_classifier.fit(train, target)
predictions = xgb_classifier.predict(test)
Sin embargo, después del entrenamiento, cuando uso este clasificador para predecir valores, toda la matriz de resultados es el mismo número. ¿Alguna idea de por qué esto estaría sucediendo?
Aclaración de datos: ~ 50 características numéricas con un objetivo numérico
También probé la Regresión RandomForest de sklearn con los mismos datos y da predicciones realistas. ¿Quizás un error legítimo en la implementación de xgboost?