Результаты поиска по запросу "apache-spark-mllib"

1 ответ

Ошибка StackOverflow при применении pyspark ALS «рекомендуемые продукты для пользователей» (хотя доступен кластер> 300 ГБ оперативной памяти)

Ищите экспертизу, чтобы вести меня в проблеме ниже.Фон:Я пытаюсь начать работу с базовым скриптом PySpark, вдохновленнымэтот примерВ качестве инфраструктуры ...

2 ответа

KMeans Spark не в состоянии обрабатывать большие данные?

KMeans имеет несколько параметров для егоповышение квалификации, с режимом инициализации по умолчанию kmeans ||. Проблема в том, что он быстро (менее 10 мину...

1 ответ

Spark RDD: Как наиболее эффективно рассчитать статистику?

Предполагая существование RDD кортежей, подобных следующему:

ТОП публикаций

2 ответа

Fgrowth вычислительная ассоциация в pyspark vs scala

1 ответ

СПС в Spark MLlib и Spark ML

У Spark теперь есть две библиотеки машинного обучения - Spark MLlib и Spark ML. Они в некоторой степени пересекаются в том, что реализовано, но, как я понима...

1 ответ

Spark ML VectorAssembler возвращает странный вывод

3 ответа

Как обслуживать модель Spark MLlib?

Я оцениваю инструменты для производственных приложений на основе ML, и один из наших вариантов - Spark MLlib, но у меня есть несколько вопросов о том, как об...

2 ответа

Не удалось преобразовать тип <class 'pyspark.ml.linalg.SparseVector'> в вектор

Учитывая мой pyspark Row объект:

2 ответа

Можем ли мы обновить существующую модель в spark-ml / spark-mllib?

Мы используем spark-ml для построения модели на основе существующих данных. Новые данные поступают ежедневно.Есть ли способ, которым мы можем только читать н...

1 ответ

Разделить содержимое столбца String в PySpark Dataframe

У меня есть фрейм данных Pyspark, в котором есть столбец, содержащий строки. Я хочу разбить этот столбец на словаКод: