Результаты поиска по запросу "rdd"

1 ответ

Фильтрация RDD на основе условий и извлечения совпавших данных в Python Spark

У меня есть данные, как,

1 ответ

Случай равенства классов в Apache Spark

9 ответов

Spark - repartition () против coalesce ()

По данным Learning SparkИмейте в виду, что перераспределение ваших данных является довольно дорогой операцией. Spark также имеет оптимизированную версию repa...

ТОП публикаций

1 ответ

Как я могу эффективно соединить большой rdd с очень большим rdd в искре?

У меня есть два RDD. Одна СДР составляет от 5 до 10 миллионов записей, а другая СДР - от 500 до 750 миллионов записей. В какой-то момент я должен присоединит...

2 ответа

val sparkSession = SparkSession.builder (). enableHiveSupport (). getOrCreate ()

разница между

1 ответ

Умножение матриц в Apache Spark [закрыто]

Я пытаюсь выполнить матричное умножение, используя Apache Spark и Java.У меня есть 2 основных вопроса:Как создать RDD, который может представлять матрицу в A...

1 ответ

Это замечательно :)

7 ответов

Объясните совокупную функциональность в Spark

4 ответа

PySpark: сопоставление SchemaRDD с SchemaRDD

4 ответа

Как найти медиану и квантили с помощью Spark