Resultados de la búsqueda a petición "pandas-groupby"
groupby contador de filas
Estoy tratando de crear una nueva variable que cuente cuántas veces se ha visto la misma identificación a lo largo del tiempo. Necesita pasar de este marco de datos id clae6 year quarter 1 475230.0 2007 1 1 475230.0 2007 2 1 475230.0 2007 3 ...
df.groupby (...) .agg (set) produce un resultado diferente en comparación con df.groupby (...) .agg (lambda x: set (x))
Respondiendoesta pregunta [https://stackoverflow.com/questions/49535966/what-is-the-pythonic-way-of-collapsing-values-into-a-set-for-multiple-columns-pe] resultó quedf.groupby(...).agg(set) ydf.groupby(...).agg(lambda x: set(x)) están produciendo ...
Suma acumulada acumulada continua
Estoy buscando crear una suma acumulativa agrupada continua. Puedo obtener el resultado a través de la iteración, pero quería ver si había una forma más inteligente. Así es como se ven los datos de origen: Per C V 1 c 3 1 a 4 1 c 1 2 a 6 2 b 5 ...
¿Cómo restablecer cumsum después de un cambio en el signo de los valores?
In [46]: d = np.random.randn(10, 1) * 2 In [47]: df = pd.DataFrame(d.astype(int), columns=['data'])Estoy tratando de crear una columna cumsum donde debería restablecerse después de un cambio de signo en la columna de datos, como este data ...
Grupo de Python Pandas por múltiples columnas, media de otra, sin grupo por objeto
Tengo algunos datos que se parecen a esto, y se llama 'test_df' ID Year Value Value2 0 A 2012 1 4 1 A 2012 2 5 2 A 2013 4 6 3 A 2013 5 7 4 B 2014 6 8 5 B 2014 7 4 6 B 2013 8 8Quiero que se vea así: ID Year Value_avg Value2_avg A 2012 1.5 4.5 A ...
Valor máximo de Python Pandas en un grupo como una nueva columna
Estoy tratando de calcular una nueva columna que contiene valores máximos para cada uno de varios grupos. Vengo de un fondo Stata, así que sé que el código Stata sería algo como esto: by group, sort: egen max = max(odds)Por ejemplo: data = ...
Contar valores únicos con pandas por grupos [duplicado]
Esta pregunta ya tiene una respuesta aquí: Pandas cuenta (distinto) equivalente [/questions/15411158/pandas-countdistinct-equivalent] 5 respuestas Necesito contar un @ úniID valores en cadadomain Tengo datos ID, domain 123, 'vk.com' 123, ...
Convertir pandas.groupby para dictar
Consider, dataframed: d = pd.DataFrame({'a': [0, 2, 1, 1, 1, 1, 1], 'b': [2, 1, 0, 1, 0, 0, 2], 'c': [1, 0, 2, 1, 0, 2, 2]} > a b c 0 0 2 1 1 2 1 0 2 1 0 2 3 1 1 1 4 1 0 0 5 1 0 2 6 1 2 2 Quiero dividirlo por columnaa en el diccionario así: {0: ...
Pandas dataframe para dictar dict
Dado el siguiente marco de datos de pandas: ColA ColB ColC 0 a1 t 1 1 a2 t 2 2 a3 d 3 3 a4 d 4 Quiero obtener un diccionario de diccionario. Pero logré crear solo lo siguiente: d = {t : [1, 2], d : [3, 4]}por d = {k: list(v) for k,v in ...
Pandas encontrar la duración entre las fechas en que se cumple una condición?
Tengo un DataFrame de pandas que se ve así: ╔═══╦════════════╦═════════════╗ ║ ║ VENDOR ID ║ DATE ║ ╠═══╬════════════╬═════════════╣ ║ 1 ║ 33 ║ 01/12/2018 ║ ║ 2 ║ 33 ║ 03/12/2018 ║ ║ 3 ║ 12 ║ 01/08/2018 ║ ║ 4 ║ 12 ║ 01/15/2018 ║ ║ 5 ║ 12 ║ ...