Результаты поиска по запросу "apache-spark-ml"

4 ответа

Как справиться с категориальными особенностями с помощью spark-ml?

Как обрабатывать категориальные данные с

1 ответ

Как получить детали слова из TF Vector RDD в Spark ML Lib?

Я создал Term Frequency, используя

3 ответа

Как сохранить модели из ML Pipeline в S3 или HDFS?

Я пытаюсь сохранить тысячи моделей, выпущенных ML Pipeline. Как указано в ответеВот, модели могут быть сохранены следующим образом:

ТОП публикаций

1 ответ

Кеширование промежуточных результатов в конвейере Spark ML

В последнее время я планирую перенести мой автономный код Python ML для запуска. Трубопровод ML в

1 ответ

Spark ML Трубопроводная логистическая регрессия дает гораздо худшие прогнозы, чем R GLM

Я использовал ML PipeLine для запуска моделей логистической регрессии, но по некоторым причинам я получил худшие результаты, чем R. Я провел некоторые исслед...

3 ответа

Как преобразовать RDD со столбцом SparseVector в DataFrame со столбцом как вектор

у меня естьРДД с кортежем значений (String, SparseVector), и я хочу создатьDataFrame с использованиемРДД, Чтобы получить (метка: строка, функции: вектор)Data...

1 ответ

Кодировать и собрать несколько функций в PySpark

У меня есть класс Python, который я использую для загрузки и обработки некоторых данных в Spark. Среди различных вещей, которые мне нужно сделать, я создаю с...

3 ответа

Spark DataFrame передает пустую строку в OneHotEncoder

Я импортирую файл CSV (используя spark-csv) в

4 ответа

Pyspark и PCA: как я могу извлечь собственные векторы этого PCA? Как я могу рассчитать, сколько дисперсии они объясняют?

Я уменьшаю размерность

2 ответа

Apache Spark создает исключение NullPointerException при обнаружении отсутствующей функции

У меня странная проблема с PySpark при индексации столбца строк в функциях. Вот мой файл tmp.csv: