Результаты поиска по запросу "rdd"

4 ответа

Вычисление средних значений для каждого KEY в парном (K, V) СДР в Spark с Python

Я хочу поделиться этим конкретным Apache Spark с решением Python, потому что документация для него довольно скудная.Я хотел вычислить среднее значение пар K ...

2 ответа

Как распечатать элементы конкретного раздела RDD в Spark?

1 ответ

reduByKey: Как это работает внутри?

Я новичок в Spark и Scala. Я был сбит с толку о том, как функция limitByKey работает в Spark. Предположим, у нас есть следующий код:

ТОП публикаций

2 ответа

Искра, когда объединение большого количества RDD выдает ошибку переполнения стека

Когда я использую «++» для объединения большого количества RDD, я получаю стек с ошибками потока.Spark версия 1.3.1 Среда: пряжа-клиент. - драйвер памяти 8GК...

2 ответа

Как проверить, находится ли Spark RDD в памяти?

1 ответ

Spark RDD записать в глобальный список

Как записать в глобальный список с rdd?

1 ответ

Есть ли способ переписать Spark RDD отдельно для использования mapPartitions вместо различных?

У меня есть RDD, который слишком велик для последовательного выполнения отдельного оператора без ложных ошибок (например, этап SparkException завершился неуд...

1 ответ

PySpark - перекрытие времени для объекта в RDD

5 ответов

Равенство DataFrame в Apache Spark

7 ответов

Spark задает условия для нескольких столбцов для объединения данных

Как дать больше условий столбца при соединении двух фреймов данных. Например, я хочу запустить следующее: