Resultados da pesquisa a pedido "pandas"
comportamento de grupo por aplicação de pandas, retornando uma série (tipo de saída inconsistente)
Estou curioso sobre o comportamento dos pandas groupby-apply quando a função apply retorna uma série. Quando as séries têm comprimentos diferentes, ele retorna uma série com vários índices. In [1]: import pandas as pd In [2]: ...
Os pandas Python comparam apenas objetos DataFrame rotulados de forma idêntica
Eu tentei todas as soluções aqui:Erro Pandas "Só é possível comparar objetos DataFrame com identificação idêntica" [https://stackoverflow.com/questions/18548370/pandas-can-only-compare-identically-labeled-dataframe-objects-error] Não funcionou ...
Interprete colunas de zeros e uns como binários e armazene como uma coluna inteira
Eu tenho um quadro de dados de zeros e uns. Eu quero tratar cada coluna como se seus valores fossem uma representação binária de um número inteiro. Qual é a maneira mais fácil de fazer essa conversão? Eu quero isso: df = pd.DataFrame([[1, 0, ...
Como recuperar dados de um QTableWidget para Dataframe?
Eu tenho um QTableWidget no modo editável no qual o usuário insere uma entrada inteira, como posso gerar uma lista de dados inseridos nesta tabela para executar operações nela? Aqui está o meu código manual para isso: def ...
Como dividir dados em 3 conjuntos (treinamento, validação e teste)?
Eu tenho um dataframe de pandas e desejo dividi-lo em 3 conjuntos separados. Eu sei que usandotrain_test_split [http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.train_test_split.html] desklearn.cross_validation, é ...
Alterando vários nomes de colunas, mas nem todos - Pandas Python
Gostaria de saber se existe uma função para alterar nomes de colunas específicos, mas sem selecionar um nome específico ou sem alterar todos eles. Eu tenho o código: df=df.rename(columns = {'nameofacolumn':'newname'})Mas com isso eu tenho ...
Como multiplicar cada linha no dataframe do pandas por um valor diferente
Estou tentando multiplicar cada linha de um dataframe de pandas por um valor diferente e me perguntando qual é a melhor maneira de fazer isso. Por exemplo, se eu tiver o seguinte quadro de dados: import numpy as np import pandas as pd df = ...
Problemas de seleção de PyTables + Pandas
Eu tenho um arquivo HDF5 (PyTables) estruturado assim: /<User>/<API Key> ex: /Dan/A4N5 /Dan/B8P0 /Dave/D3Y7Cada tabela está estruturada da seguinte maneira com um sessionID e um tempo armazenado na época: sessionID time 0 3ODE3Nzll 1467590400 1 ...
Os pandas poderiam usar a coluna como índice?
Eu tenho uma planilha como esta: Locality 2005 2006 2007 2008 2009 ABBOTSFORD 427000 448000 602500 600000 638500 ABERFELDIE 534000 600000 735000 710000 775000 AIREYS INLET459000 440000 430000 517500 512500Não quero trocar manualmente a coluna ...
Como carregar dados em pedaços de um dataframe do pandas para um spark dataframe
Eu li dados em pedaços através de uma conexão pyodbc usando algo como isto: import pandas as pd import pyodbc conn = pyodbc.connect("Some connection Details") sql = "SELECT * from TABLES;" df1 = pd.read_sql(sql,conn,chunksize=10) Agora eu quero ...