¿Cómo transformar una variable categórica en Spark en un conjunto de columnas codificadas como {0,1}?

Estoy tratando de realizar una regresión logística (LogisticRegressionWithLBFGS) con Spark MLlib (con Scala) en un conjunto de datos que contiene variables categóricas. Descubrí que Spark no pudo trabajar con ese tipo de variable.

En R hay una manera simple de lidiar con ese tipo de problema: transformo la variable en factor (categorías), por lo que R crea un conjunto de columnas codificadas como variables indicadoras {0,1}.

¿Cómo puedo realizar esto con Spark?

Respuestas a la pregunta(4)

Su respuesta a la pregunta