Elección de elementos aleatorios de un objeto Spark GroupedData

Question

Nov 17, 2015, 06:44 AM

Soy nuevo en el uso de Spark en Python y no he podido resolver este problema: después de ejecutargroupBy en unpyspark.sql.dataframe.DataFrame

df = sqlsc.read.json("data.json")
df.groupBy('teamId')

como puedes elegirN ¿Muestras aleatorias de cada grupo resultante (agrupadas por teamId) sin reemplazo?

Básicamente estoy tratando de elegirN usuarios aleatorios de cada equipo, tal vez usandogroupBy está mal empezar?

Respuestas a la pregunta(1)

Debugging javascript en tabletas / teléfonos Android?

Regex acepta numérico solamente. El primer personaje no puede ser 0

Powershell básico: conversión por lotes de Word Docx a PDF

Repita los valores en múltiples parcelas cuando faceten

Distribución, gestión e informes de trabajos distribuidos