Elección de elementos aleatorios de un objeto Spark GroupedData
Soy nuevo en el uso de Spark en Python y no he podido resolver este problema: después de ejecutargroupBy
en unpyspark.sql.dataframe.DataFrame
df = sqlsc.read.json("data.json")
df.groupBy('teamId')
como puedes elegirN
¿Muestras aleatorias de cada grupo resultante (agrupadas por teamId) sin reemplazo?
Básicamente estoy tratando de elegirN
usuarios aleatorios de cada equipo, tal vez usandogroupBy
está mal empezar?