Resultados da pesquisa a pedido "pandas-groupby"

1 a resposta

Converter pandas.groupby em dict

Considere, dataframed: d = pd.DataFrame({'a': [0, 2, 1, 1, 1, 1, 1], 'b': [2, 1, 0, 1, 0, 0, 2], 'c': [1, 0, 2, 1, 0, 2, 2]} > a b c 0 0 2 1 1 2 1 0 2 1 0 2 3 1 1 1 4 1 0 0 5 1 0 2 6 1 2 2Quero dividi-lo por colunaa no dicionário assim: {0: a b ...

3 a resposta

Soma cumulativa agrupada de rolamento

Estou procurando criar uma soma cumulativa agrupada sem interrupção. Posso obter o resultado via iteração, mas queria ver se havia uma maneira mais inteligente. Aqui está a aparência dos dados de origem: Per C V 1 c 3 1 a 4 1 c 1 2 a 6 2 b 5 3 ...

2 a resposta

df.groupby (…) .agg (set) produz resultados diferentes em comparação com df.groupby (…) .agg (lambda x: set (x))

Respondendoessa questão [https://stackoverflow.com/questions/49535966/what-is-the-pythonic-way-of-collapsing-values-into-a-set-for-multiple-columns-pe] descobriu-se quedf.groupby(...).agg(set) edf.groupby(...).agg(lambda x: set(x)) estão ...

1 a resposta

Python Pandas agrupa por várias colunas, média de outra - nenhum grupo por objeto

Eu tenho alguns dados parecidos com este e chamados 'test_df' ID Year Value Value2 0 A 2012 1 4 1 A 2012 2 5 2 A 2013 4 6 3 A 2013 5 7 4 B 2014 6 8 5 B 2014 7 4 6 B 2013 8 8Eu quero que fique assim: ID Year Value_avg Value2_avg A 2012 1.5 4.5 A ...

2 a resposta

Dataframe de pandas para ditar dict

Dado o seguinte quadro de dados do pandas: ColA ColB ColC 0 a1 t 1 1 a2 t 2 2 a3 d 3 3 a4 d 4Eu quero pegar um dicionário de dicionário. Mas consegui criar apenas o seguinte: d = {t : [1, 2], d : [3, 4]}por: d = {k: list(v) for k,v in ...

1 a resposta

Como redefinir cumsum após alteração no sinal de valores?

In [46]: d = np.random.randn(10, 1) * 2 In [47]: df = pd.DataFrame(d.astype(int), columns=['data'])Estou tentando criar uma coluna cumsum onde ela deve redefinir após uma alteração de sinal na coluna de dados, como esta data custom_cumsum 0 -2 ...

4 a resposta

Grupo de pandas por várias colunas, lista de várias colunas

Eu tenho os seguintes dados: Invoice NoStockCode Description Quantity CustomerID Country 536365 85123A WHITE HANGING HEART T-LIGHT HOLDER 6 17850 United Kingdom 536365 71053 WHITE METAL LANTERN 6 17850 United Kingdom 536365 84406B CREAM CUPID ...

1 a resposta

Os pandas encontram duração entre as datas em que uma condição é atendida?

Eu tenho um DataFrame de pandas que se parece com isso: ╔═══╦════════════╦═════════════╗ ║ ║ VENDOR ID ║ DATE ║ ╠═══╬════════════╬═════════════╣ ║ 1 ║ 33 ║ 01/12/2018 ║ ║ 2 ║ 33 ║ 03/12/2018 ║ ║ 3 ║ 12 ║ 01/08/2018 ║ ║ 4 ║ 12 ║ 01/15/2018 ║ ║ 5 ...

2 a resposta

Valor máximo do Python Pandas em um grupo como uma nova coluna

Estou tentando calcular uma nova coluna que contém valores máximos para cada um dos vários grupos. Eu sou proveniente de um background Stata, então eu sei que o código Stata seria algo como isto: by group, sort: egen max = max(odds)Por ...

3 a resposta

Pandas Dataframe: como adicionar uma coluna com o número de ocorrências em outra coluna

Eu tenho que seguir df: Col1 Col2 test Something test2 Something test3 Something test Something test2 Something test5 SomethingEu quero pegar Col1 Col2 Occur test Something 2 test2 Something 2 test3 Something 1 test Something 2 test2 Something ...