Grupo de Dataframe do Apache Spark por agg () para várias colunas
eu tenho umDataFrame
com 3 colunas, ou seja,Id, First Name, Last Name
Eu quero aplicarGroupBy
com base emId
e quer colecionarFirst Name, Last Name
coluna como lista.
Exemplo: - Eu tenho um DF como este
+---+-------+--------+
|id |fName |lName |
+---+-------+--------+
|1 |Akash |Sethi |
|2 |Kunal |Kapoor |
|3 |Rishabh|Verma |
|2 |Sonu |Mehrotra|
+---+-------+--------+
e eu quero minha saída assim
+---+-------+--------+--------------------+
|id |fname |lName |
+---+-------+--------+--------------------+
|1 |[Akash] |[Sethi] |
|2 |[Kunal, Sonu] |[Kapoor, Mehrotra] |
|3 |[Rishabh] |[Verma] |
+---+-------+--------+--------------------+
Desde já, obrigado