Resultados da pesquisa a pedido "pandas"
Cálculo do número de valores iguais consecutivos específicos de maneira vetorizada em pandas
Digamos que temos os seguintes pandas DataFrame: In [1]: import pandas as pd import numpy as np df = pd.DataFrame([0, 1, 0, 0, 1, 1, 0, 1, 1, 1], columns=['in']) df Out[1]: in 0 0 1 1 2 0 3 0 4 1 5 1 6 0 7 1 8 1 9 1Como contar o número de ...
Divida o quadro de dados do Pandas por rótulos que não estão em uma lista
eu tenho umpandas quadro de dados,df. Quero selecionar todos os índices emdf que sãonãoem uma lista,blacklist. Agora, uso a compreensão da lista para criar os rótulos desejados para fatiar. ix=[i for i in df.index if i not in blacklist] ...
Remover listas vazias da série pandas
Eu tenho uma longa série como a seguinte: series = pd.Series([[(1,2)],[(3,5)],[],[(3,5)]]) In [151]: series Out[151]: 0 [(1, 2)] 1 [(3, 5)] 2 [] 3 [(3, 5)] dtype: objectQuero remover todas as entradas com uma lista vazia. Por algum motivo, a ...
Valor absoluto para a coluna em Python
Como eu poderia converter os valores da coluna 'count' em valor absoluto? Um resumo do meu quadro de dados: datetime count 0 2011-01-20 00:00:00 14.565996 1 2011-01-20 01:00:00 10.204177 2 2011-01-20 02:00:00 -1.261569 3 2011-01-20 03:00:00 ...
python cria um quadro de dados com uma linha por uma lista
em python, digamos que eu tenha uma lista [1,2,3, ..., 100] e gostaria de usar essa lista para criar um dataframe que tenha uma linha e o valor da linha seja a lista. Qual é a maneira mais rápida e elegante de fazer isso?
Especifique várias alterações de tipo de dados de colunas para diferentes tipos de dados no pyspark
Eu tenho um DataFrame (df), que consiste em mais de 50 colunas e diferentes tipos de dados, como df3.printSchema() CtpJobId: string (nullable = true) |-- TransformJobStateId: string (nullable = true) |-- LastError: string (nullable = true) ...
Excluir duplicatas em um quadro de dados com base em duas combinações de colunas?
Eu tenho um dataframe com 3 colunas em Python: Name1 Name2 Value Juan Ale 1 Ale Juan 1e gostaria de eliminar as duplicatas com base nas combinações de colunas Nome1 e Nome2. No meu exemplo, as duas linhas são iguais (mas estão em ordem ...
Ocorreu um problema ao passar no lambda para solicitar o panda DataFrame
Estou tentando aplicar uma função a todas as linhas de um DataFrame do pandas (na verdade, apenas uma coluna nesse DataFrame) Tenho certeza de que este é um erro de sintaxe, mas sei com certeza o que estou fazendo de ...
Escreva comentários no arquivo CSV com pandas
Gostaria de escrever alguns comentários no meu arquivo CSV criado compandas. Não encontrei nenhuma opção para isso emDataFrame.to_csv (Apesar deread_csv pode pular comentários) nem no padrãocsv módulo. Eu posso abrir o arquivo, escrever os ...
Extraindo coeficientes do GLM em Python usando o statsmodel
Eu tenho um modelo que é definido da seguinte maneira: import statsmodels.formula.api as smf model = smf.glm(formula="A ~ B + C + D", data=data, family=sm.families.Poisson()).fit()O modelo possui coeficientes com a seguinte aparência: Intercept ...