Resultados da pesquisa a pedido "pandas"

1 a resposta

ANOVA em python usando pandas dataframe com statsmodels ou scipy?

Eu quero usar o quadro de dados do Pandas para dividir a variação em uma variável. Por exemplo, se eu tenho uma coluna chamada 'Graus', e a tenho indexada para várias datas, cidades e noite versus dia, desejo descobrir qual fração da variação ...

5 a resposta

Vários histogramas em pandas

Gostaria de criar o seguinte histograma (veja a imagem abaixo) retirado do livro "Think Stats". No entanto, não consigo colocá-los no mesmo enredo. Cada DataFrame obtém sua própria subtrama. Eu tenho o seguinte código: import nsfg import ...

1 a resposta

Diferença entre cada linha e coluna em dois DataFrames (Python / Pandas)

Existe uma maneira mais eficiente de comparar todas as colunas de todas as linhas de um DF com todas as colunas de todas as linhas de outro DF? Isso parece desleixado para mim, mas minhas tentativas de loop / aplicar foram muito mais lentas. df1 ...

4 a resposta

Como iterar em pedaços consecutivos do dataframe do Pandas com eficiência

Eu tenho um grande quadro de dados (vários milhões de linhas). Eu quero poder fazer uma operação de grupo por ele, mas apenas agrupando por subconjuntos consecutivos arbitrários (de preferência do mesmo tamanho) de linhas, em vez de usar ...

1 a resposta

Traçando séries temporais usando o Seaborn FacetGrid

Eu tenho um DataFrame (data) com um índice inteiro simples e 5 colunas. As colunas sãoDate, Country, AgeGroup, Gender, Stat. (Os nomes foram alterados para proteger os inocentes.) Gostaria de produzir umFacetGrid onde oCountry define ...

3 a resposta

Obter dados de pandas em um servidor SQL com PYODBC

Estou tentando entender como o python pode extrair dados de um servidor FTP para pandas e depois mover para o SQL server. Meu código aqui é muito rudimentar, para dizer o mínimo, e estou procurando algum conselho ou ajuda. Eu tentei carregar os ...

3 a resposta

Python: Converta timedelta em int em um dataframe

Gostaria de criar uma coluna em um quadro de dados do pandas que seja uma representação inteira do número de dias em uma coluna timedelta. É possível usar 'datetime.days' ou preciso fazer algo mais manual? coluna timedelta 7 dias, ...

2 a resposta

Linhas duplicadas no pandas DF

Eu tenho um DF no Pandas, que se parece com: Letters Numbers A 1 A 3 A 2 A 1 B 1 B 2 B 3 C 2 C 2Estou procurando contar o número de linhas semelhantes e salvar o resultado em uma terceira coluna. Por exemplo, a saída que estou ...

1 a resposta

Usando rolling_apply com uma função que requer 2 argumentos no Pandas

Estou tentando usar rollapply com uma fórmula que requer 2 argumentos. Que eu saiba, a única maneira (a menos que você crie a fórmula do zero) para calcular a correlação Kendall Tau, com a correção de empate padrão incluída é: >>> import scipy ...

7 a resposta

Traçando CDF de uma série de pandas em python

Existe uma maneira de fazer isso? Não consigo parecer uma maneira fácil de relacionar séries de pandas com a plotagem de um CDF.