Resultados da pesquisa a pedido "pandas"
Como posso selecionar uma coluna específica de cada linha em um DataFrame do Pandas?
Eu tenho um DataFrame neste formato: a b c 0 1 2 3 1 4 5 6 2 7 8 9 3 10 11 12 4 13 14 15e uma matriz como esta, com nomes de colunas: ['a', 'a', 'b', 'c', 'b']e espero extrair uma matriz de dados, um valor de cada linha. A matriz de nomes de ...
Data máxima e mínima no grupo de pandas
Eu tenho um quadro de dados que se parece com: data = {'index': ['2014-06-22 10:46:00', '2014-06-24 19:52:00', '2014-06-25 17:02:00', '2014-06-25 17:55:00', '2014-07-02 11:36:00', '2014-07-06 12:40:00', '2014-07-05 12:46:00', '2014-07-27 ...
Como encontro colunas numéricas no Pandas?
Digamosdf é um DataFrame de pandas. Gostaria de encontrar todas as colunas do tipo numérico. Algo como: isNumeric = is_numeric(df)
Isso tem problemas de desempenho?
Percebi um desempenho muito ruim ao usar itows de pandas. Isso é algo experimentado por outros? É específico para as seguintes linhas e essa função deve ser evitada para dados de um determinado tamanho (estou trabalhando com 2 a 3 milhões de ...
Como verificar se existe uma coluna no Pandas
Existe uma maneira de verificar se existe uma coluna em um DataFrame do Pandas? Suponha que eu tenha o seguinte DataFrame: >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], ...
Python (pandas): armazena um quadro de dados em hdf5 com um índice múltiplo
Eu preciso trabalhar com um quadro de dados de grande dimensão com vários índices, então tentei criar um quadro de dados para aprender como armazená-lo em um arquivo hdf5. O quadro de dados é assim: (com o multi-índice nas 2 ...
Alterando nomes de colunas no Pandas com colunas hierárquicas
Digamos que eu tenho um quadro de dados com um índice hierárquico: >>> df = pd.DataFrame(np.ones((2, 4))) >>> df 0 1 2 3 0 1 1 1 1 1 1 1 1 1 [2 rows x 4 columns] >>> df.columns = pd.MultiIndex.from_product([['a', 'b'], ['i', 'ii']]) >>> df a b i ...
Formatação de separador de milhar para números inteiros em um dataframe de pandas
Estou tentando usar'{:,}'.format(number) como o exemplo abaixo para formatar um número em um dataframe do pandas: # This works for floats and integers print '{:,}'.format(20000) # 20,000 print '{:,}'.format(20000.0) # 20,000.0O problema é que, ...
Uma maneira melhor de carregar dados do MongoDB para um DataFrame usando Pandas e PyMongo?
Eu tenho um banco de dados MongoDB de 0,7 GB contendo tweets que estou tentando carregar em um dataframe. No entanto, recebo um erro. MemoryError:Meu código fica assim: cursor = tweets.find() #Where tweets is my collection tweet_fields = ...
especificando "ignorar NA" ao calcular a média da coluna em um quadro de dados criado pelo Pandas
Estou aprendendoPandas replicando o passeio de algumas das vinhetas R. Agora estou usando odplyr pacote de R como um ...