Как агрегировать значения в коллекцию после groupBy?
У меня есть датафрейм со схемой как таковой:
[visitorId: string, trackingIds: array<string>, emailIds: array<string>]
Ищете способ сгруппировать (или, возможно, свести?) Этот фрейм данных по посетителю, где столбцы trackingIds и emailIds будут добавляться вместе. Так, например, если мой начальный df выглядит так:
visitorId |trackingIds|emailIds
+-----------+------------+--------
|a158| [666b] | [12]
|7g21| [c0b5] | [45]
|7g21| [c0b4] | [87]
|a158| [666b, 777c]| []
Я хотел бы, чтобы мой вывод df выглядел так
visitorId |trackingIds|emailIds
+-----------+------------+--------
|a158| [666b,666b,777c]| [12,'']
|7g21| [c0b5,c0b4] | [45, 87]
Попытка использоватьgroupBy
а такжеagg
но операторы не сильно повезло.