Resultados da pesquisa a pedido "pandas"
Pandas grouby and transform ('count') gera erro de posicionamento - funciona bem em conjuntos de dados menores
Tarefa realmente simples no Pandas está lançando um erro que eu não entendo. Com um conjunto de dados simples como este: test=pd.DataFrame([[1,3],[1,6],[2,4],[3,9],[3,2]],columns=['a','b'])Posso executar o seguinte para contar o número de vezes ...
Função de fusão dos pandas
Eu tenho um quadro de dados: df = pd.DataFrame([[2, 4, 7, 8, 1, 3, 2013], [9, 2, 4, 5, 5, 6, 2014]], columns=['Amy', 'Bob', 'Carl', 'Chris', 'Ben', 'Other', 'Year']) Amy Bob Carl Chris Ben Other Year 0 2 4 7 8 1 3 2013 1 9 2 4 5 5 6 2014E um ...
Como substituir todos os valores em um Dataframe do Pandas e não em uma lista?
Eu tenho uma lista de valores. Como posso substituir todos os valores em uma coluna Dataframe que não estão na lista de valores fornecida? Por exemplo, >>> df = pd.DataFrame(['D','ND','D','garbage'], columns=['S']) >>> df S 0 D 1 ND 2 D 3 ...
Mostrar todos os quadros de dados do pandas em um notebook IPython
Como eu pude identificar todos os DataFrames do Pandas criados na minha sessão atual do notebook? Algo como no SAS ver todos os membros da biblioteca de Trabalho seria o ideal. Obrigado.
Grupo DataFrame do Pandas por intervalos sobrepostos de comprimento variável
Estou tentando agrupar um DataFrame por 2 colunas (veja o exemplo abaixo). Para a primeira coluna, quero que cada valor pertença a um grupo. Para a segunda coluna, quero agrupar intervalos sobrepostos de tamanho desigual. Meu entendimento é que ...
distinção dos pandas entre os tipos str e objeto
Numpy parece fazer uma distinção entrestr eobject tipos. Por exemplo, eu posso fazer: >>> import pandas as pd >>> import numpy as np >>> np.dtype(str) dtype('S') >>> np.dtype(object) dtype('O')Onde dtype ('S') e dtype ('O') correspondem ...
Por que aplicar o tipo de alteração nas colunas do quadro de dados do pandas
Eu tenho o seguinte quadro de dados: import pandas as pd import numpy as np df = pd.DataFrame(dict(A = np.arange(3), B = np.random.randn(3), C = ['foo','bar','bah'], D = pd.Timestamp('20130101'))) print(df) A B C D 0 0 -1.087180 foo 2013-01-01 1 ...
ajuste de valor p Teste U de Mann-Whitney em python
Eu tenho um arquivo de lista bidimensional (nome - 'hcl_file'). Uma versão reduzida do arquivo para maior clareza. Número de observações verticais, experimento horizontal: ID type First Second Third gerg I 0.02695 0 0.00135 0.31312 11P I ...
Grupo de pandas por resultado em várias colunas
Eu tenho um quadro de dados no qual estou procurando agrupar e particionar os valores dentro de um grupo em várias colunas. Por exemplo: digamos que tenho o seguinte quadro de dados: >>> import pandas as pd >>> import numpy as np >>> ...
Dados longos a amplos. Pandas
Estou tentando tirar meu dataframe de um formato longo, no qual tenho uma coluna com uma variável categórica, em um formato amplo, no qual cada categoria tem sua própria coluna de preço. Atualmente, meus dados são assim: date-time date vendor ...