Resultados da pesquisa a pedido "pandas"
Como dividir um dataframe ou série de pandas por dia (possivelmente usando um iterador)
Eu tenho uma longa série temporal, por exemplo. import pandas as pd index=pd.date_range(start='2012-11-05', end='2012-11-10', freq='1S').tz_localize('Europe/Berlin') df=pd.DataFrame(range(len(index)), index=index, columns=['Number'])Agora eu ...
Encontre todos os índices do máximo no Pandas DataFrame
Eu preciso encontrar todos os índices onde o valor máximo (por linha) é obtido em um DataFrame do Pandas. Por exemplo, se eu tiver um dataFrame assim: cat1 cat2 cat3 0 0 2 2 1 3 0 1 2 1 1 0o método que eu estou procurando produziria um resultado ...
Manipulação de números ENORMES em numpy ou pandas
Estou fazendo um concurso no qual recebo dados anonimizados. Algumas colunas têm valores ENORMES. O maior tinha 40 dígitos! eu useipd.read_csv mas essas colunas foram convertidas em objetos como resultado. Meu plano original era reduzir os ...
Como retirar o espaço em branco dos cabeçalhos do Pandas DataFrame?
Estou analisando dados de um arquivo do Excel que possui espaço em branco extra em alguns dos títulos da coluna. Quando verifico as colunas do quadro de dados resultante, da seguinte maneira: df.columns O resultado fica assim: Index(['Year', ...
Executando uma função que adiciona colunas e as preenche, dependendo de outras colunas no Pandas
Eu tenho um quadro de dados que contém um texto e um resultado Text Result 0 some text... True 1 another one... FalseE eu tenho uma função que faz uma extração de recursos do texto - retorna dict com cerca de 1000 teclas que são palavras e ...
como posso atualizar o dataframe do pandas para manter o original no canto superior esquerdo?
Eu tenho uma situação como essa, um dataframe original do pandas, por exemplo, como: columnA columnB 1 2 1 3então, devido à atualização, esta tabela fica assim: columnA columnB columnC 2 3 2 2 4 3 1 3 3No entanto, eu quero manter a ...
módulo 'pandas' não tem atributo 'rolling_mean'
Estou tentando criar um ARIMA para detecção de anomalias. Preciso encontrar a média móvel do gráfico de séries temporais. Estou tentando usar os pandas 0,23 para isso. import pandas as pd import numpy as np from statsmodels.tsa.stattools ...
pandas dataframe: loc vs desempenho da consulta
Eu tenho 2 quadros de dados em python que gostaria de consultar dados. DF1: 4M registra x 3 colunas. A função de consulta é mais eficiente que a função loc. DF2: 2K registra x 6 colunas. A função loc é muito mais eficiente que a ...
substituir linhas em um quadro de dados do pandas
Quero começar com um quadro de dados vazio e depois adicionar uma linha a cada vez. Eu posso até começar com um quadro de dados 0data=pd.DataFrame(np.zeros(shape=(10,2)),column=["a","b"]) e substitua uma linha de cada vez. Como eu posso fazer isso?
Como definir uma variável para ser a data de hoje em Python / Pandas
Estou tentando definir uma variável para igualar a data de hoje. Eu procurei isso e encontrei um artigo relacionado: Defina a data de hoje como valor padrão no ...