Результаты поиска по запросу "rdd"
Вычисление средних значений для каждого KEY в парном (K, V) СДР в Spark с Python
Я хочу поделиться этим конкретным Apache Spark с решением Python, потому что документация для него довольно скудная.Я хотел вычислить среднее значение пар K ...
reduByKey: Как это работает внутри?
Я новичок в Spark и Scala. Я был сбит с толку о том, как функция limitByKey работает в Spark. Предположим, у нас есть следующий код:
Искра, когда объединение большого количества RDD выдает ошибку переполнения стека
Когда я использую «++» для объединения большого количества RDD, я получаю стек с ошибками потока.Spark версия 1.3.1 Среда: пряжа-клиент. - драйвер памяти 8GК...
Spark RDD записать в глобальный список
Как записать в глобальный список с rdd?
Есть ли способ переписать Spark RDD отдельно для использования mapPartitions вместо различных?
У меня есть RDD, который слишком велик для последовательного выполнения отдельного оператора без ложных ошибок (например, этап SparkException завершился неуд...
Spark задает условия для нескольких столбцов для объединения данных
Как дать больше условий столбца при соединении двух фреймов данных. Например, я хочу запустить следующее: