Resultados da pesquisa a pedido "pandas-groupby"
Converter pandas.groupby em dict
Considere, dataframed: d = pd.DataFrame({'a': [0, 2, 1, 1, 1, 1, 1], 'b': [2, 1, 0, 1, 0, 0, 2], 'c': [1, 0, 2, 1, 0, 2, 2]} > a b c 0 0 2 1 1 2 1 0 2 1 0 2 3 1 1 1 4 1 0 0 5 1 0 2 6 1 2 2Quero dividi-lo por colunaa no dicionário assim: {0: a b ...
Soma cumulativa agrupada de rolamento
Estou procurando criar uma soma cumulativa agrupada sem interrupção. Posso obter o resultado via iteração, mas queria ver se havia uma maneira mais inteligente. Aqui está a aparência dos dados de origem: Per C V 1 c 3 1 a 4 1 c 1 2 a 6 2 b 5 3 ...
df.groupby (…) .agg (set) produz resultados diferentes em comparação com df.groupby (…) .agg (lambda x: set (x))
Respondendoessa questão [https://stackoverflow.com/questions/49535966/what-is-the-pythonic-way-of-collapsing-values-into-a-set-for-multiple-columns-pe] descobriu-se quedf.groupby(...).agg(set) edf.groupby(...).agg(lambda x: set(x)) estão ...
Python Pandas agrupa por várias colunas, média de outra - nenhum grupo por objeto
Eu tenho alguns dados parecidos com este e chamados 'test_df' ID Year Value Value2 0 A 2012 1 4 1 A 2012 2 5 2 A 2013 4 6 3 A 2013 5 7 4 B 2014 6 8 5 B 2014 7 4 6 B 2013 8 8Eu quero que fique assim: ID Year Value_avg Value2_avg A 2012 1.5 4.5 A ...
Dataframe de pandas para ditar dict
Dado o seguinte quadro de dados do pandas: ColA ColB ColC 0 a1 t 1 1 a2 t 2 2 a3 d 3 3 a4 d 4Eu quero pegar um dicionário de dicionário. Mas consegui criar apenas o seguinte: d = {t : [1, 2], d : [3, 4]}por: d = {k: list(v) for k,v in ...
Como redefinir cumsum após alteração no sinal de valores?
In [46]: d = np.random.randn(10, 1) * 2 In [47]: df = pd.DataFrame(d.astype(int), columns=['data'])Estou tentando criar uma coluna cumsum onde ela deve redefinir após uma alteração de sinal na coluna de dados, como esta data custom_cumsum 0 -2 ...
Grupo de pandas por várias colunas, lista de várias colunas
Eu tenho os seguintes dados: Invoice NoStockCode Description Quantity CustomerID Country 536365 85123A WHITE HANGING HEART T-LIGHT HOLDER 6 17850 United Kingdom 536365 71053 WHITE METAL LANTERN 6 17850 United Kingdom 536365 84406B CREAM CUPID ...
Os pandas encontram duração entre as datas em que uma condição é atendida?
Eu tenho um DataFrame de pandas que se parece com isso: ╔═══╦════════════╦═════════════╗ ║ ║ VENDOR ID ║ DATE ║ ╠═══╬════════════╬═════════════╣ ║ 1 ║ 33 ║ 01/12/2018 ║ ║ 2 ║ 33 ║ 03/12/2018 ║ ║ 3 ║ 12 ║ 01/08/2018 ║ ║ 4 ║ 12 ║ 01/15/2018 ║ ║ 5 ...
Valor máximo do Python Pandas em um grupo como uma nova coluna
Estou tentando calcular uma nova coluna que contém valores máximos para cada um dos vários grupos. Eu sou proveniente de um background Stata, então eu sei que o código Stata seria algo como isto: by group, sort: egen max = max(odds)Por ...
Pandas Dataframe: como adicionar uma coluna com o número de ocorrências em outra coluna
Eu tenho que seguir df: Col1 Col2 test Something test2 Something test3 Something test Something test2 Something test5 SomethingEu quero pegar Col1 Col2 Occur test Something 2 test2 Something 2 test3 Something 1 test Something 2 test2 Something ...