Почему число разделов после groupBy 200? Почему этот 200 не какой-то другой номер?
Это Spark 2.2.0-SNAPSHOT.
Почему количество разделов послеgroupBy
преобразование 200 в следующем примере?
scala> spark.range(5).groupByKey(_ % 5).count.rdd.getNumPartitions
res0: Int = 200
Что такого особенного в200
? Почему не какой-то другой номер, как1024
?
Мне сказали оПочему операция groupByKey всегда имеет 200 задач? что конкретно спрашивает оgroupByKey
, но вопрос о "загадке" за комплектацией200
по умолчанию нет, почему есть 200 разделов по умолчанию.