Resultados da pesquisa a pedido "pandas"

2 a resposta

Estimativa de regressão de rolamento no quadro de dados Python

Eu tenho um quadro de dados como este: Date Y X1 X2 X3 22 2004-05-12 9.348158e-09 0.000081 0.000028 0.000036 23 2004-05-13 9.285989e-09 0.000073 0.000081 0.000097 24 2004-05-14 9.732308e-09 0.000085 0.000073 0.000096 25 2004-05-17 2.235977e-08 ...

5 a resposta

Numpy "onde" com várias condições

Eu tento adicionar uma nova coluna "energy_class" a um dataframe "df_energy" que contenha a string "high" se o valor "consumer_energy" for> 400, "medium" se o valor "consumer_energy" estiver entre 200 e 400 e " baixo "se o valor" consumer_energy ...

1 a resposta

Definir valores no subconjunto do Pandas DataFrame (cópia) é lento

import timeit import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 10)) dft = df[[True, False] * 5] # df = dft dft2 = dft.copy() new_data = np.random.rand(5, 10) print(timeit.timeit('dft.loc[:, :] = new_data', setup='from ...

3 a resposta

localize a posição numérica de um valor de índice não numérico

Considere a séries abaixo: s = pd.Series(np.arange(18, 0, -3), list('ABCDEF')) s A 18 B 15 C 12 D 9 E 6 F 3 dtype: int32Quero obter a posição numérica de'D' Isso será suficiente, mas acho que todos podemos concordar que isso é ...

0 a resposta

Como obter com eficiência a matriz de correlação (com valores-p) de um quadro de dados com valores de NaN?

Estou tentando calcular uma matriz de correlação e filtrar as correlações com base nos valores de p para descobrir os pares altamente correlacionados. Para explicar o que quero dizer, diga que tenho um quadro de dados como este. df A B C D 0 2 ...

2 a resposta

Como lidar com essa lógica complexa em pandas python

Eu tenho alguns dados como seguir a estrutura. Ele foi usado no python pandas Data Frame e o nomeei df. Data1,Data2,Flag 2016-04-29,00:40:15,1 2016-04-29,00:40:24,2 2016-04-29,00:40:35,2 2015-04-29,00:40:36,2 ...

2 a resposta

Python - Largue a linha se duas colunas forem NaN

Esta é uma extensão paraessa questão [https://stackoverflow.com/questions/13413590/how-to-drop-rows-of-pandas-dataframe-whose-value-of-certain-column-is-nan] , em que o OP queria saber como descartar linhas em que os valores em uma única coluna ...

2 a resposta

Groupby de pandas e soma apenas uma coluna

Então, eu tenho um quadro de dados, df1, que se parece com o seguinte: A B C 1 foo 12 California 2 foo 22 California 3 bar 8 Rhode Island 4 bar 32 Rhode Island 5 baz 15 Ohio 6 baz 26 OhioQuero agrupar pela coluna A e somar a coluna B, mantendo o ...

3 a resposta

Obter primeiro e segundo valores mais altos nas colunas pandas

Estou usando pandas para analisar alguns resultados das eleições. Eu tenho um DF, Results, que tem uma linha para cada círculo eleitoral e colunas representando os votos para os vários partidos (mais de 100 deles): In[60]: Results.columns ...

2 a resposta

Pandas - desempilhar os valores das colunas em novas colunas

Eu tenho um grande quadro de dados e estou armazenando muitos valores redundantes que dificultam o tratamento dos meus dados. Eu tenho um quadro de dados do formulário: import pandas as pd df = pd.DataFrame([["a","g","n1","y1"], ...