¿Cómo agregar valores en la colección después de groupBy?
Tengo un marco de datos con esquema como tal:
[visitorId: string, trackingIds: array<string>, emailIds: array<string>]
¿Está buscando una forma de agrupar (o quizás acumular?) Este marco de datos por visitante donde las columnas trackingIds y emailIds se unirían. Entonces, por ejemplo, si mi df inicial se ve así:
visitorId |trackingIds|emailIds
+-----------+------------+--------
|a158| [666b] | [12]
|7g21| [c0b5] | [45]
|7g21| [c0b4] | [87]
|a158| [666b, 777c]| []
Me gustaría que mi salida df se vea así
visitorId |trackingIds|emailIds
+-----------+------------+--------
|a158| [666b,666b,777c]| [12,'']
|7g21| [c0b5,c0b4] | [45, 87]
Intentando usargroupBy
yagg
operadores pero no tienen mucha suerte.