Utilizando Smote con Gridsearchcv en Scikit-learn

Estoy tratando con un conjunto de datos desequilibrado y quiero hacer una búsqueda en la cuadrícula para ajustar los parámetros de mi modelo usando gridsearchcv de scikit. Para sobremuestrear los datos, quiero usar SMOTE, y sé que puedo incluir eso como una etapa de una tubería y pasarlo a gridsearchcv. Mi preocupación es que creo que smote se aplicará tanto al tren como a los pliegues de validación, que no es lo que se supone que debes hacer. El conjunto de validación no se debe sobremuestrear. ¿Tengo razón en que toda la tubería se aplicará a ambas divisiones de conjunto de datos? Y si es así, ¿cómo puedo cambiar esto? Muchas gracias por adelantad

Respuestas a la pregunta(1)

Su respuesta a la pregunta