Результаты поиска по запросу "apache-spark-ml"

0 ответов

Как оценить модель spark.ml без DataFrames / SparkContext?

С Spark MLLib я бы построил модель (например,

0 ответов

@Angelito Основная сериализация данных с паркетом уменьшит время перемешивания для разделов, потому что «сокращает» структуру данных

ользую Spark ML для запуска некоторых экспериментов ML и на небольшом наборе данных размером 20 МБ (Набор данных покера [http://archive.ics.uci.edu/ml/machine-learning-databases/poker/poker-hand-testing.data] ) и Случайный лес с сеткой ...

0 ответов

 распространяется, но, насколько я могу судить, это не так. Спасибо за помощь.

ользуюSpark ML GBTClassifier [https://spark.apache.org/docs/2.2.0/api/python/pyspark.ml.html#pyspark.ml.classification.GBTClassifier] вpyspark обучить бинарную модель классификации на фрейме данных с ~ 400 тыс. строк и ~ 9 тыс. столбцов в ...

ТОП публикаций

1 ответ

Как получить детали слова из TF Vector RDD в Spark ML Lib?

Я создал Term Frequency, используя

1 ответ

Кеширование промежуточных результатов в конвейере Spark ML

В последнее время я планирую перенести мой автономный код Python ML для запуска. Трубопровод ML в

1 ответ

Spark ML Трубопроводная логистическая регрессия дает гораздо худшие прогнозы, чем R GLM

Я использовал ML PipeLine для запуска моделей логистической регрессии, но по некоторым причинам я получил худшие результаты, чем R. Я провел некоторые исслед...

1 ответ

Кодировать и собрать несколько функций в PySpark

У меня есть класс Python, который я использую для загрузки и обработки некоторых данных в Spark. Среди различных вещей, которые мне нужно сделать, я создаю с...

1 ответ

Spark, Scala, DataFrame: создание векторов объектов

у меня есть

1 ответ

СПАРК М.Л., Наивный байесовский классификатор: прогноз высокой вероятности для одного класса

Я использую Spark ML для оптимизации Naive Ba, да, мультиклассового классификатора.У меня есть около 300 категорий, и я классифицирую текстовые документы. Тр...

1 ответ

Настройка формул расстояния для K-средних в Apache Spark Python

Сейчас я использую K-средства для кластеризации и отслеживанияэтот урок а такжеAPI.Но я хочу использовать пользовательскую формулу для расчета расстояний. Ит...