Manejo de valores desconocidos para la codificación de etiquetas

¿Cómo puedo manejar valores desconocidos para la codificación de etiquetas en sk-learn? El codificador de etiquetas solo explotará con la excepción de que se detectaron nuevas etiquetas.

Lo que quiero es elcodificación de variables categóricas víauno caliente-encoder. Sin embargo, sk-learn no admite cadenas para eso. Así que usé un codificador de etiquetas en cada columna.

Mi problema es que en mi paso de validación cruzada de la tubería aparecen etiquetas desconocidas. El codificador básico de uno en caliente tendría la opción de ignorar tales casos. A prioripandas.getDummies /cat.codes no es suficiente ya que la tubería debería funcionar con datos entrantes nuevos y reales que también pueden contener etiquetas desconocidas.

¿Sería posible usar unCountVectorizer ¿para este propósito?

Respuestas a la pregunta(1)

Su respuesta a la pregunta