Как получить массив / пакет элементов из группы Hive оператором?

Я хочу сгруппировать по заданному полю и получить вывод с сгруппированными полями. Ниже приведен пример того, чего я пытаюсь достичь:

Представьте себе таблицу с именемsample_table» с двумя столбцами, как показано ниже:

F1  F2
001 111
001 222
001 123
002 222
002 333
003 555

Я хочу написать Hive Query, который выдаст следующий вывод:

001 [111, 222, 123]
002 [222, 333]
003 [555]

В Pig это может быть легко достигнуто чем-то вроде этого:

grouped_relation = GROUP sample_table BY F1;

Может кто-нибудь предложить, если есть простой способ сделать это в Hive? Я могу подумать о том, чтобы написать для этого пользовательскую функцию (UDF), но это может быть очень трудоемким вариантом.

Ответы на вопрос(2)

Ваш ответ на вопрос