Resultados da pesquisa a pedido "pandas"
Pandas: valor médio dos últimos n dias
eu tenho umPandas quadro de dados como este: test = pd.DataFrame({ 'Date' : ['2016-04-01','2016-04-01','2016-04-02', '2016-04-02','2016-04-03','2016-04-04', '2016-04-05','2016-04-06','2016-04-06'], 'User' : ...
pd.read_csv não está analisando corretamente o campo de data / mês ao definir parse_date = ['nome da coluna']
Corri para esse bug ao tentar analisar as poucas datas através de parse_dates depandas.read_csv(). No seguinte snippet de código, estou tentando analisar datas com formatodd/mm/yy o que está me resultando em uma conversão imprópria. Para alguns ...
Usando pandas .append dentro do loop for
Estou anexando linhas a um DataFrame do pandas em um loop for, mas no final o dataframe está sempre vazio. Não quero adicionar as linhas a uma matriz e, em seguida, chamar o construtor DataFrame, porque meu loop for real lida com muitos dados. Eu ...
Adicionando cabeçalhos de coluna ao novo quadro de dados do pandas
Estou criando um novo quadro de dados do pandas a partir de um quadro de dados anterior usando o.groupby e.size métodos. [in] results = df.groupby(["X", "Y", "Z", "F"]).size() [out] 9 27/02/2016 1 N 326 9 27/02/2016 1 S 332 9 27/02/2016 2 N 280 ...
HTML não renderizado corretamente com o Canopy 1.7.1.3323 / IPython 4.1.2
Acabei de atualizar para o Canopy 1.7.1; Eu acho que esse problema decorre da mudança na versão IPython da 2.4.1 para a 4.1.2. O problema que tenho é que chamar um objeto DataFrame em Python parece usar o__print__ método, ou seja, não há ...
Qual é a maneira mais rápida de fazer upload de um grande arquivo csv no notebook para trabalhar com pandas python?
Estou tentando fazer upload de um arquivo csv, com 250 MB. Basicamente, 4 milhões de linhas e 6 colunas de dados de séries temporais (1min). O procedimento usual é: location = r'C:\Users\Name\Folder_1\Folder_2\file.csv' df ...
operação panda dataframe str.contains () AND
O df (Pandas Dataframe) possui três linhas. some_col_name "apple is delicious" "banana is delicious" "apple and banana both are delicious"df.col_name.str.contains("apple|banana") vai pegar todas as linhas: "apple is delicious", "banana is ...
Como usar o groupby nos pandas para calcular uma porcentagem / proporção total com base nos critérios de outra coluna
Estou tentando descobrir como usar ogroupby funcionar nos pandas para calcular as proporções de valores por ano com um determinado critério Sim / Não. Por exemplo, eu tenho um quadro de dados chamadonames: Name Number Year Sex Criteria 0 name1 ...
Remova as extremidades das entradas de sequência na coluna DataFrame do pandas
Eu tenho um Dataframe pandas com uma coluna uma lista de arquivos import pandas as pd df = pd.read_csv('fname.csv') df.head() filename A B C fn1.txt 2 4 5 fn2.txt 1 2 1 fn3.txt .... ....Eu gostaria de excluir a extensão do arquivo.txt de cada ...
Implementação vetorizada para criar várias linhas a partir de uma única linha no dataframe do pandas
Para cada linha na tabela de entrada, preciso gerar várias linhas, separando o período com base em mensalmente. (consulte a saída de amostra abaixo). Existe uma abordagem iterativa simples para converter linha por linha, mas é muito lenta em ...