Как преобразовать категориальную переменную в Spark в набор столбцов, закодированных как {0,1}?

Question

May 07, 2015, 04:56 PM

categorical-data scala apache-spark-mllib bigdata apache-spark

Как преобразовать категориальную переменную в Spark в набор столбцов, закодированных как {0,1}?

Я пытаюсь выполнить логистическую регрессию (LogisticRegressionWithLBFGS) с помощью Spark MLlib (с Scala) для набора данных, который содержит категориальные переменные. Я обнаружил, что Spark не смог работать с такими переменными.

В R существует простой способ решения такой проблемы: я преобразую переменную в фактор (категории), поэтому R создает набор столбцов, закодированных как {0,1} индикаторных переменных.

Как я могу выполнить это с Spark?

Как преобразовать категориальную переменную в Spark в набор столбцов, закодированных как {0,1}?

Ответы на вопрос(4)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Как преобразовать категориальную переменную в Spark в набор столбцов, закодированных как {0,1}?

Ответы на вопрос(4)

Ваш ответ на вопрос

Популярные вопросы