Resultados da pesquisa a pedido "dataframe"
Como substituo códigos numéricos por rótulos de valor de uma tabela de pesquisa?
Esta questão está relacionada comessa questão, mas não exatamente o mesmo.Digamos que eu tenha esse quadro de dados
Agrupar valores de 2 colunas em uma única coluna em um dataframe de pandas
Estou procurando um método que se comporte de maneira semelhante à coalescência no T-SQL. Eu tenho 2 colunas (colunas A e B) que são escassamente preenchidas em um dataframe de pandas. Gostaria de criar uma nova coluna usando as ...
Estimativa de regressão de rolamento no quadro de dados Python
Eu tenho um quadro de dados como este: Date Y X1 X2 X3 22 2004-05-12 9.348158e-09 0.000081 0.000028 0.000036 23 2004-05-13 9.285989e-09 0.000073 0.000081 0.000097 24 2004-05-14 9.732308e-09 0.000085 0.000073 0.000096 25 2004-05-17 2.235977e-08 ...
Substituir valores específicos com base em outro quadro de dados
Primeiro, vamos começar com o DataFrame 1 (DF1): DF1 <- data.frame(c("06/19/2016", "06/20/2016", "06/21/2016", "06/22/2016", "06/23/2016", "06/19/2016", "06/20/2016", "06/21/2016", "06/22/2016", "06/23/2016"), c(1, 1, 1, 1, 1, 2, 2, 2, 2, 2), ...
Calculando médias por hora a partir de uma série temporal de vários anos
Eu tenho um conjunto de dados preenchido com a velocidade média do vento por hora durante vários anos. Eu gostaria de criar um 'ano médio', no qual, ...
Numpy "onde" com várias condições
Eu tento adicionar uma nova coluna "energy_class" a um dataframe "df_energy" que contenha a string "high" se o valor "consumer_energy" for> 400, "medium" se o valor "consumer_energy" estiver entre 200 e 400 e " baixo "se o valor" consumer_energy ...
lendas do ggplot quando o plot é construído a partir de dois quadros de dados
Eu tenho dados provenientes de dois quadros de dados diferentes. Estou tentando criar legenda para cada quadro de dados. Sei que posso combinar o quadro de dados e fazê-lo, mas, devido à minha fonte de dados, faz mais sentido plotar a partir de ...
Definir valores no subconjunto do Pandas DataFrame (cópia) é lento
import timeit import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 10)) dft = df[[True, False] * 5] # df = dft dft2 = dft.copy() new_data = np.random.rand(5, 10) print(timeit.timeit('dft.loc[:, :] = new_data', setup='from ...
Como lidar com essa lógica complexa em pandas python
Eu tenho alguns dados como seguir a estrutura. Ele foi usado no python pandas Data Frame e o nomeei df. Data1,Data2,Flag 2016-04-29,00:40:15,1 2016-04-29,00:40:24,2 2016-04-29,00:40:35,2 2015-04-29,00:40:36,2 ...
Substitua <NA> em uma coluna de fator
Eu quero substituir<NA> valores em uma coluna de fatores com um valor válido. Mas não consigo encontrar um caminho. Este exemplo é apenas para demonstração. Os dados originais vêm de um arquivo CSV estrangeiro com o qual tenho que lidar. df <- ...