Является ли groupByKey когда-либо предпочтительнее

Я всегда используюreduceByKey когда мне нужно сгруппировать данные в RDD, потому что он выполняет уменьшение на стороне карты перед перетасовкой данных, что часто означает, что меньше данных перетасовывается, и таким образом я получаю более высокую производительность. Даже когда функция уменьшения на стороне карты собирает все значения и фактически не уменьшает объем данных, я все равно используюreduceByKeyпотому что я предполагаю, что производительностьreduceByKey никогда не будет хуже чемgroupByKey, Однако мне интересно, верно ли это предположение или действительно есть ситуации, когдаgroupByKey должно быть предпочтительным

Ответы на вопрос(3)

Ваш ответ на вопрос