Resultados de la búsqueda a petición "group-by"
divida el df original después de la operación groupby (). nlargest (x)
Dados los problemas congroupby() ynlargest() tal como se ...
GroupByKey y cree listas de valores pyspark sql dataframe
Entonces tengo un marco de datos de chispa que se parece a: a | b | c 5 | 2 | 1 5 | 4 | 3 2 | 4 | 2 2 | 3 | 7Y quiero agrupar por columnaa, cree una lista de valores de la columna b, y olvídese de c. El marco de datos de salida sería: a | ...
seleccione el N más grande de una columna de cada grupo por grupo usando pandas
Mi df: {'city1': {0: 'Chicago', 1: 'Chicago', 2: 'Chicago', 3: 'Chicago', 4: 'Miami', 5: 'Houston', 6: 'Austin'}, 'city2': {0: 'Toronto', 1: 'Detroit', 2: 'St.Louis', 3: 'Miami', 4: 'Dallas', 5: 'Dallas', 6: 'Dallas'}, 'p234_r_c': {0: 5.0, 1: ...
en R, ¿cómo calcular la media de todas las columnas, por grupo?
Necesito obtener la media de todas las columnas de un gran conjunto de datos usando R, agrupadas por 2 variables. Probémoslo con mtcars: library(dplyr) g_mtcars <- group_by(mtcars, cyl, gear) summarise(g_mtcars, mean (hp)) # Source: local data ...
Cómo agrupar elementos similares en un feed de actividad
Para un sitio de red social, tengo una actividad de eventos de personas a las que sigues, y me gustaría agrupar tipos similares de eventos realizados en un corto período de tiempo, para una fuente de actividad más compacta. Imagine cómo Facebook ...
LINQ: seleccione registros con el valor máximo de propiedad por grupo
Tengo un conjunto de datos como este: GroupName GroupValue MemberName MemberValue 'Group1' 1 'Member1' 1 'Group1' 1 'Member2' 2 'Group2' 2 'Member3' 3 'Group2' 2 'Member4' 2 'Group3' 2 'Member5' 4 'Group3' 2 'Member6' 1Lo que quiero seleccionar ...
Los pandas se agrupan, ¿en un marco de datos?
Digamos que mis datos se ven así: date,name,id,dept,sale1,sale2,sale3,total_sale 1/1/17,John,50,Sales,50.0,60.0,70.0,180.0 1/1/17,Mike,21,Engg,43.0,55.0,2.0,100.0 ...
Suma conjunto de valores del marco de datos de pandas dentro de cierto marco de tiempo
Tengo una pregunta bastante complicada. Necesito seleccionar filas de un marco de datos dentro de un determinado conjunto de fechas de inicio y finalización, y luego sumar esos valores y ponerlos en un nuevo marco de datos. Así que empiezo con ...
¿Cómo concatenar cadenas de un campo de cadena en una consulta PostgreSQL 'group by'?
Estoy buscando una forma de concatenar las cadenas de un campo dentro de un grupo por consulta. Entonces, por ejemplo, tengo una tabla: ID COMPANY_ID EMPLOYEE 1 1 Anna 2 1 Bill 3 2 Carol 4 2 Davey quería agrupar por company_id para obtener algo ...
¿Cómo dividir el marco de datos en pandas en múltiples marcos de datos basados en el grupo por resultados?
Date_A Date_B Date_C Amount 0 09/01/2016 09/01/2016 01/01/1800 2405814.36 1 09/01/2016 09/01/2016 09/01/2016 11347445.71 2 09/01/2016 10/01/2016 01/01/1800 5005106.94 3 09/01/2016 10/01/2016 09/02/2016 391679.95 4 09/01/2016 ...