Результаты поиска по запросу "apache-spark-mllib"
Ошибка StackOverflow при применении pyspark ALS «рекомендуемые продукты для пользователей» (хотя доступен кластер> 300 ГБ оперативной памяти)
Ищите экспертизу, чтобы вести меня в проблеме ниже.Фон:Я пытаюсь начать работу с базовым скриптом PySpark, вдохновленнымэтот примерВ качестве инфраструктуры ...
KMeans Spark не в состоянии обрабатывать большие данные?
KMeans имеет несколько параметров для егоповышение квалификации, с режимом инициализации по умолчанию kmeans ||. Проблема в том, что он быстро (менее 10 мину...
Spark RDD: Как наиболее эффективно рассчитать статистику?
Предполагая существование RDD кортежей, подобных следующему:
СПС в Spark MLlib и Spark ML
У Spark теперь есть две библиотеки машинного обучения - Spark MLlib и Spark ML. Они в некоторой степени пересекаются в том, что реализовано, но, как я понима...
Как обслуживать модель Spark MLlib?
Я оцениваю инструменты для производственных приложений на основе ML, и один из наших вариантов - Spark MLlib, но у меня есть несколько вопросов о том, как об...
Не удалось преобразовать тип <class 'pyspark.ml.linalg.SparseVector'> в вектор
Учитывая мой pyspark Row объект:
Можем ли мы обновить существующую модель в spark-ml / spark-mllib?
Мы используем spark-ml для построения модели на основе существующих данных. Новые данные поступают ежедневно.Есть ли способ, которым мы можем только читать н...
Разделить содержимое столбца String в PySpark Dataframe
У меня есть фрейм данных Pyspark, в котором есть столбец, содержащий строки. Я хочу разбить этот столбец на словаКод: