Агрегирование нескольких столбцов с пользовательской функцией в Spark
Мне было интересно, если есть какой-то способ указать пользовательскую функцию агрегирования для фреймов данных искры по нескольким столбцам.
У меня есть такая таблица типа (имя, предмет, цена):
john | tomato | 1.99
john | carrot | 0.45
bill | apple | 0.99
john | banana | 1.29
bill | taco | 2.59
чтобы:
Я хотел бы объединить элемент и его стоимость для каждого человека в такой список:
john | (tomato, 1.99), (carrot, 0.45), (banana, 1.29)
bill | (apple, 0.99), (taco, 2.59)
Возможно ли это в кадрах данных? Я недавно узнал оcollect_list
но, похоже, работает только для одного столбца.