Como encontrar a média das colunas de vetor agrupadas no Spark SQL?
Eu criei umRelationalGroupedDataset
chamandoinstances.groupBy(instances.col("property_name"))
:
val x = instances.groupBy(instances.col("property_name"))
Como componho umfunção agregada definida pelo usuário executarStatistics.colStats (). Mean em cada grupo?
Obrigado!