Resultados da pesquisa a pedido "pandas"
ANOVA em python usando pandas dataframe com statsmodels ou scipy?
Eu quero usar o quadro de dados do Pandas para dividir a variação em uma variável. Por exemplo, se eu tenho uma coluna chamada 'Graus', e a tenho indexada para várias datas, cidades e noite versus dia, desejo descobrir qual fração da variação ...
Vários histogramas em pandas
Gostaria de criar o seguinte histograma (veja a imagem abaixo) retirado do livro "Think Stats". No entanto, não consigo colocá-los no mesmo enredo. Cada DataFrame obtém sua própria subtrama. Eu tenho o seguinte código: import nsfg import ...
Diferença entre cada linha e coluna em dois DataFrames (Python / Pandas)
Existe uma maneira mais eficiente de comparar todas as colunas de todas as linhas de um DF com todas as colunas de todas as linhas de outro DF? Isso parece desleixado para mim, mas minhas tentativas de loop / aplicar foram muito mais lentas. df1 ...
Como iterar em pedaços consecutivos do dataframe do Pandas com eficiência
Eu tenho um grande quadro de dados (vários milhões de linhas). Eu quero poder fazer uma operação de grupo por ele, mas apenas agrupando por subconjuntos consecutivos arbitrários (de preferência do mesmo tamanho) de linhas, em vez de usar ...
Traçando séries temporais usando o Seaborn FacetGrid
Eu tenho um DataFrame (data) com um índice inteiro simples e 5 colunas. As colunas sãoDate, Country, AgeGroup, Gender, Stat. (Os nomes foram alterados para proteger os inocentes.) Gostaria de produzir umFacetGrid onde oCountry define ...
Obter dados de pandas em um servidor SQL com PYODBC
Estou tentando entender como o python pode extrair dados de um servidor FTP para pandas e depois mover para o SQL server. Meu código aqui é muito rudimentar, para dizer o mínimo, e estou procurando algum conselho ou ajuda. Eu tentei carregar os ...
Python: Converta timedelta em int em um dataframe
Gostaria de criar uma coluna em um quadro de dados do pandas que seja uma representação inteira do número de dias em uma coluna timedelta. É possível usar 'datetime.days' ou preciso fazer algo mais manual? coluna timedelta 7 dias, ...
Linhas duplicadas no pandas DF
Eu tenho um DF no Pandas, que se parece com: Letters Numbers A 1 A 3 A 2 A 1 B 1 B 2 B 3 C 2 C 2Estou procurando contar o número de linhas semelhantes e salvar o resultado em uma terceira coluna. Por exemplo, a saída que estou ...
Usando rolling_apply com uma função que requer 2 argumentos no Pandas
Estou tentando usar rollapply com uma fórmula que requer 2 argumentos. Que eu saiba, a única maneira (a menos que você crie a fórmula do zero) para calcular a correlação Kendall Tau, com a correção de empate padrão incluída é: >>> import scipy ...
Traçando CDF de uma série de pandas em python
Existe uma maneira de fazer isso? Não consigo parecer uma maneira fácil de relacionar séries de pandas com a plotagem de um CDF.