Является ли groupByKey когда-либо предпочтительнее

Question

Oct 19, 2015, 08:49 PM

Является ли groupByKey когда-либо предпочтительнее

Я всегда используюreduceByKey когда мне нужно сгруппировать данные в RDD, потому что он выполняет уменьшение на стороне карты перед перетасовкой данных, что часто означает, что меньше данных перетасовывается, и таким образом я получаю более высокую производительность. Даже когда функция уменьшения на стороне карты собирает все значения и фактически не уменьшает объем данных, я все равно используюreduceByKeyпотому что я предполагаю, что производительностьreduceByKey никогда не будет хуже чемgroupByKey, Однако мне интересно, верно ли это предположение или действительно есть ситуации, когдаgroupByKey должно быть предпочтительным

Является ли groupByKey когда-либо предпочтительнее

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Является ли groupByKey когда-либо предпочтительнее

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы