Агрегирование нескольких столбцов с пользовательской функцией в Spark

Мне было интересно, если есть какой-то способ указать пользовательскую функцию агрегирования для фреймов данных искры по нескольким столбцам.

У меня есть такая таблица типа (имя, предмет, цена):

john | tomato | 1.99
john | carrot | 0.45
bill | apple  | 0.99
john | banana | 1.29
bill | taco   | 2.59

чтобы:

Я хотел бы объединить элемент и его стоимость для каждого человека в такой список:

john | (tomato, 1.99), (carrot, 0.45), (banana, 1.29)
bill | (apple, 0.99), (taco, 2.59)

Возможно ли это в кадрах данных? Я недавно узнал оcollect_list но, похоже, работает только для одного столбца.

Ответы на вопрос(4)

Ваш ответ на вопрос