Resultados da pesquisa a pedido "pandas"

1 a resposta

Adicionando uma coluna específica de um dataframe do Pandas para outro dataframe do Pandas

Estou tentando adicionar uma coluna a um dataframe do pandas (df1) que possui uma coluna identificador exclusivo ('id') de outro dataframe (df2) que possui o mesmo identificador exclusivo ('sameid'). Eu tentei mesclar, mas preciso adicionar ...

4 a resposta

Células IPython Notebook múltiplas saídas

Estou executando esta célula no IPython Notebook: # salaries and teams are Pandas dataframe salaries.head() teams.head()O resultado é que estou obtendo apenas a saída deteams quadro de dados em vez de ambossalaries eteams. Se eu apenas ...

4 a resposta

Como criar um DataFrame fora das linhas, mantendo o esquema existente?

Se eu ligar para o mapa oumapPartition e minha função recebe linhas do PySpark, qual é a maneira natural de criar um PySpark local ou o Pandas DataFrame? Algo que combina as linhas e mantém o esquema? Atualmente eu faço algo como: def ...

2 a resposta

Retirando todos os espaços vazios à direita em uma coluna de um dataframe de pandas

eu tenho umpandas DFque tem muitoselementos de stringque contém palavras como esta: 'Frost 'Que tem muitos espaços em branco à frente. Quando eu comparo essa string com: 'Frost'Eu percebi que a comparação eraFalsodevido aos espaços ...

2 a resposta

Pivotando um Dataframe do Pandas contendo seqüências de caracteres - erro 'Não há tipos numéricos para agregar'

Há um bom número de perguntas sobre esse erro, mas, depois de olhar em volta, ainda não sou capaz de encontrar / compreender minha solução ainda. Estou tentando dinamizar um quadro de dados com seqüências de caracteres, para obter alguns dados de ...

3 a resposta

Decomposição da tendência, elementos sazonais e residuais das séries temporais

eu tenho umDataFrame com algumas séries temporais: divida movav12 var varmovav12 Date 2004-01 0 NaN NaN NaN 2004-02 0 NaN NaN NaN 2004-03 0 NaN NaN NaN 2004-04 34 NaN inf NaN 2004-05 30 NaN -0.117647 NaN 2004-06 44 NaN 0.466667 NaN 2004-07 35 ...

2 a resposta

Transformação no estilo pandas de dados agrupados no PySpark DataFrame

Se tivermos um quadro de dados do Pandas que consiste em uma coluna de categorias e uma coluna de valores, podemos remover a média em cada categoria, fazendo o seguinte: df["DemeanedValues"] = df.groupby("Category")["Values"].transform(lambda g: ...

1 a resposta

pesquisa difusa entre 2 séries / df.columns

Com base neste link, eu estava tentando fazer uma pesquisa difusa:Aplique a correspondência difusa em uma coluna do quadro de dados e salve os resultados em uma nova ...

5 a resposta

O DataFrame do Pandas verifica se o valor da coluna existe em um grupo de colunas

Eu tenho um DataFrame como este (exemplo simplificado) id v0 v1 v2 v3 v4 1 10 5 10 22 50 2 22 23 55 60 50 3 8 2 40 80 110 4 15 15 25 100 101E gostaria de criar uma coluna adicional que seja 1 ou 0. 1 se o valor de v0 estiver nos valores de v1 a ...

4 a resposta

Informações sobre o fuso horário da faixa em pandas

Tenho lutado para remover as informações de fuso horário de uma coluna em um dataframe do pandas. Eu verifiquei a seguinte pergunta, mas ela não funciona para mim: Posso exportar o panda DataFrame para o Excel removendo o ...