Resultados da pesquisa a pedido "pandas-groupby"
Concat dataframes python com base em linhas exclusivas
Meu dataframe tem a seguinte aparência: df1 user_id username firstname lastname 123 abc abc abc 456 def def def 789 ghi ghi ghidf2 user_id username firstname lastname 111 xyz xyz xyz 456 def def def 234 mnp mnp mnpAgora eu quero um dataframe ...
agrupar dados por estação, de acordo com as datas exatas
Eu tenho um arquivo CSV contendo 4 anos de dados e estou tentando agrupar dados por temporada ao longo dos 4 anos, dizendo de forma diferente, preciso resumir e plotar meus dados inteiros em apenas 4 temporadas. aqui está uma olhada no ...
Como dinamizar um quadro de dados
O que é pivô?Como eu giro?Isso é um pivô?Formato longo para formato amplo?Eu já vi muitas perguntas sobre tabelas dinâmicas. Mesmo que eles não saibam que estão perguntando sobre tabelas dinâmicas, geralmente o são. É praticamente ...
pandas: GroupBy .pipe () vs .apply ()
No exemplo dodocumentação dos pandas [https://pandas.pydata.org/pandas-docs/stable/groupby.html#groupby-pipe]sobre o novo.pipe() método para objetos GroupBy, um.apply() O método que aceita o mesmo lambda retornaria os mesmos resultados. In ...
Como eliminar duplicatas com base em dois ou mais critérios de subconjuntos no quadro de dados do Pandas
Vamos dizer que este é o meu quadro de dados df = pd.DataFrame({ 'bio' : ['1', '1', '1', '4'], 'center' : ['one', 'one', 'two', 'three'], 'outcome' : ['f','t','f','f'] })Se parece com isso ... bio center outcome 0 1 one f 1 1 one t 2 1 two f 3 ...
Pandas reindexam para preencher datas ausentes, ou melhor método para preencher?
Meus dados são registros de ausência de uma fábrica. Alguns dias não há ausências, portanto não há dados ou data registrados para esse dia. No entanto, e onde isso fica complicado com os outros exemplos mostrados, em qualquer dia, pode haver ...
Por que o primeiro e o último do grupo não me dão o primeiro e o último
Estou postando isso porque o tópico acabou de ser abordado em outra pergunta / resposta e o comportamento não está muito bem documentado. Considere o quadro de dadosdf df = pd.DataFrame(dict( A=list('xxxyyy'), B=[np.nan, 1, 2, 3, 4, np.nan] )) ...
Os pandas Python classificam / classificam com base em outra coluna que difere para cada entrada
Gostaria de criar a quarta coluna abaixo com base nos três primeiros: user job time Rank A print 1559 2 A print 1540 2 A edit 1520 1 A edit 1523 1 A deliver 9717 3 B edit 1717 2 B edit 1716 2 B edit 1715 2 B deliver 1527 1 B deliver 1524 1A ...
Groupby Pandas Como mostrar contagens zero no DataFrame
Eu tenho o seguinte dataframe do Pandas: Name | EventSignupNo | Attended | Points Smith | 0145 | Y | 20.24 Smith | 0174 | Y | 29.14 Smith | 0239 | N | 0 Adams | 0145 | N | 0 Adams | 0174 | Y | 33.43 Morgan | 0239 | Y | 31.23 Morgan | 0244 | Y | ...