GridSearchCV - XGBoost - Parada temprana
Estoy tratando de hacer una búsqueda hiperparemeter con el uso de GridSearchCV de scikit-learn en XGBoost. Durante la búsqueda en la cuadrícula, me gustaría que se detuviera antes, ya que reduce drásticamente el tiempo de búsqueda y (esperando) tener mejores resultados en mi tarea de predicción / regresión. Estoy usando XGBoost a través de su API Scikit-Learn.
model = xgb.XGBRegressor()
GridSearchCV(model, paramGrid, verbose=verbose ,fit_params={'early_stopping_rounds':42}, cv=TimeSeriesSplit(n_splits=cv).get_n_splits([trainX, trainY]), n_jobs=n_jobs, iid=iid).fit(trainX,trainY)
Intenté dar parámetros de detención temprana con el uso de fit_params, pero luego arroja este error que se debe básicamente a la falta de conjunto de validación que se requiere para la detención temprana:
/opt/anaconda/anaconda3/lib/python3.5/site-packages/xgboost/callback.py in callback(env=XGBoostCallbackEnv(model=<xgboost.core.Booster o...teration=4000, rank=0, evaluation_result_list=[]))
187 else:
188 assert env.cvfolds is not None
189
190 def callback(env):
191 """internal function"""
--> 192 score = env.evaluation_result_list[-1][1]
score = undefined
env.evaluation_result_list = []
193 if len(state) == 0:
194 init(env)
195 best_score = state['best_score']
196 best_iteration = state['best_iteration']
¿Cómo puedo aplicar GridSearch en XGBoost usando early_stopping_rounds?
nota: el modelo funciona sin gridsearch, también GridSearch funciona sin 'fit_params = {' early_stopping_rounds ': 42}