Resultados da pesquisa a pedido "pandas"
Pandas: Melhores expressões idiomáticas para renomear e reordenar colunas enquanto agrega
Eu tenho pandasDataFrame como isso: n = 6000 my_data = DataFrame ({ "Category" : np.random.choice (['cat1','cat2'], size=n) , "val_1" : np.random.randn(n) , "val_2" : [i for i in range (1,n+1)] }) Estou agregandoCategorye aplicando funções ...
remova o nome, dtype da saída dos pandas
Eu tenho arquivo de saída como este a partir de uma função de pandas. Series([], name: column, dtype: object) 311 race 317 gender Name: column, dtype: objectEstou tentando obter uma saída com apenas a segunda coluna, ou seja, race ...
Matriz de distância para linhas no dataframe do pandas
Eu tenho um dataframe de pandas com a seguinte aparência: In [23]: dataframe.head() Out[23]: column_id 1 10 11 12 13 14 15 16 17 18 ... 46 47 48 49 5 50 \ row_id ... 1 NaN NaN 1 1 1 1 1 1 1 1 ... 1 1 NaN 1 NaN NaN 10 1 1 1 1 1 1 1 1 1 NaN ... 1 ...
python pandas to_sql com sqlalchemy: como acelerar a exportação para o MS SQL?
Eu tenho um dataframe com ca 155.000 linhas e 12 colunas. Se eu exportá-lo para csv com dataframe.to_csv, a saída é um arquivo de 11 MB (produzido instantaneamente). Se, no entanto, eu exportar para um Microsoft SQL Server com o método ...
Por que numpy / pandas analisa um arquivo csv com longas linhas tão lento?
Estou tentando analisar com eficiência um arquivo csv com cerca de 20.000 entradas por linha (e alguns milhares de linhas) em uma matriz numpy (ou lista de matrizes ou qualquer coisa semelhante realmente). Encontrei várias outras perguntas, junto ...
Pandas, agrupados em que o valor da coluna é maior que x
Eu tenho uma mesa assim timestamp avg_hr hr_quality avg_rr rr_quality activity sleep_summary_id 1422404668 66 229 0 0 13 78 1422404670 64 223 0 0 20 78 1422404672 64 216 0 0 11 78 1422404674 66 198 0 40 9 78 1422404676 65 184 0 30 3 78 ...
Atualizar linha existente no banco de dados do pandas df
Eu tenho um banco de dados PostgreSQL. O Pandas possui uma função 'to_sql' para gravar os registros de um quadro de dados em um banco de dados. Mas não encontrei nenhuma documentação sobre como atualizar uma linha de banco de dados existente ...
Pandas: Verificando se uma data é feriado e atribuindo valor booleano
Eu tenho um quadro de dados do pandas com coluna de data e estou tentando adicionar uma nova coluna de valores booleanos indicando se uma determinada data é feriado ou não. A seguir está o código, mas ele não funciona (todos os valores são ...
Como adicionar uma subparcela a um grupo de plotagens
Eu tenho um grupo deplots que eu quero exibir comosubplots. Posso adicionar a maioria deles, mas estou lutando para adicionar um em particular. Para o código abaixo, posso adicionar osubplot paraPlot One ePlot Three mas não posso adicionar a ...
Obter número de linhas antes e depois de um certo valor de índice nos pandas
Digamos que tenho o seguinte: In [1]: import pandas as pd import numpy as np df = pd.DataFrame(data=np.random.rand(11),index=pd.date_range('2015-04-20','2015-04-30'),columns=['A']) Out[1]: A 2015-04-20 0.694983 2015-04-21 0.393851 2015-04-22 ...