Результаты поиска по запросу "apache-spark"

2 ответа

Стратифицированный отбор проб в Искре

У меня есть набор данных, который содержит данные пользователя и покупки. Вот пример, где первый элемент - userId, второй - productId, а третий - логический.

6 ответов

IntelliJ Идея 14: не может разрешить искру символа

Я сделал зависимость от Spark, которая работала в моем первом проекте. Но когда я пытаюсь создать новый проект с помощью Spark, мой SBT не импортирует внешни...

2 ответа

Удалить искровой фрейм данных из кеша

Я использую Spark 1.3.0 с Python API. Преобразуя огромные кадры данных, я кэширую много DF для более быстрого выполнения;

ТОП публикаций

4 ответа

Искра: Разница между произвольной записью, случайным разливом (памятью), случайным разливом (диском)?

У меня следующая искровая работа, пытаюсь сохранить все в памяти:

1 ответ

Как использовать искровой наивный байесовский классификатор для классификации текста с IDF?

Я хочу преобразовать текстовые документы в векторы функций, используя tf-idf, а затем обучить наивный алгоритм Байеса для их классификации.Я могу легко загру...

4 ответа

как изменить столбец Dataframe с типа String на тип Double в pyspark

У меня есть датафрейм с колонкой как String. Я хотел изменить тип столбца на тип Double в PySpark.Вот как я это сделал:

3 ответа

Как сохранить модели из ML Pipeline в S3 или HDFS?

Я пытаюсь сохранить тысячи моделей, выпущенных ML Pipeline. Как указано в ответеВот, модели могут быть сохранены следующим образом:

1 ответ

Как получить детали слова из TF Vector RDD в Spark ML Lib?

Я создал Term Frequency, используя

1 ответ

Записать данные в Redis из PySpark

В Scala мы бы написали RDD для Redis следующим образом:

4 ответа

Как справиться с категориальными особенностями с помощью spark-ml?

Как обрабатывать категориальные данные с