Resultados da pesquisa a pedido "pandas"

1 a resposta

Pandas: Melhores expressões idiomáticas para renomear e reordenar colunas enquanto agrega

Eu tenho pandasDataFrame como isso: n = 6000 my_data = DataFrame ({ "Category" : np.random.choice (['cat1','cat2'], size=n) , "val_1" : np.random.randn(n) , "val_2" : [i for i in range (1,n+1)] }) Estou agregandoCategorye aplicando funções ...

1 a resposta

remova o nome, dtype da saída dos pandas

Eu tenho arquivo de saída como este a partir de uma função de pandas. Series([], name: column, dtype: object) 311 race 317 gender Name: column, dtype: objectEstou tentando obter uma saída com apenas a segunda coluna, ou seja, race ...

2 a resposta

Matriz de distância para linhas no dataframe do pandas

Eu tenho um dataframe de pandas com a seguinte aparência: In [23]: dataframe.head() Out[23]: column_id 1 10 11 12 13 14 15 16 17 18 ... 46 47 48 49 5 50 \ row_id ... 1 NaN NaN 1 1 1 1 1 1 1 1 ... 1 1 NaN 1 NaN NaN 10 1 1 1 1 1 1 1 1 1 NaN ... 1 ...

2 a resposta

python pandas to_sql com sqlalchemy: como acelerar a exportação para o MS SQL?

Eu tenho um dataframe com ca 155.000 linhas e 12 colunas. Se eu exportá-lo para csv com dataframe.to_csv, a saída é um arquivo de 11 MB (produzido instantaneamente). Se, no entanto, eu exportar para um Microsoft SQL Server com o método ...

4 a resposta

Por que numpy / pandas analisa um arquivo csv com longas linhas tão lento?

Estou tentando analisar com eficiência um arquivo csv com cerca de 20.000 entradas por linha (e alguns milhares de linhas) em uma matriz numpy (ou lista de matrizes ou qualquer coisa semelhante realmente). Encontrei várias outras perguntas, junto ...

1 a resposta

Pandas, agrupados em que o valor da coluna é maior que x

Eu tenho uma mesa assim timestamp avg_hr hr_quality avg_rr rr_quality activity sleep_summary_id 1422404668 66 229 0 0 13 78 1422404670 64 223 0 0 20 78 1422404672 64 216 0 0 11 78 1422404674 66 198 0 40 9 78 1422404676 65 184 0 30 3 78 ...

1 a resposta

Atualizar linha existente no banco de dados do pandas df

Eu tenho um banco de dados PostgreSQL. O Pandas possui uma função 'to_sql' para gravar os registros de um quadro de dados em um banco de dados. Mas não encontrei nenhuma documentação sobre como atualizar uma linha de banco de dados existente ...

2 a resposta

Pandas: Verificando se uma data é feriado e atribuindo valor booleano

Eu tenho um quadro de dados do pandas com coluna de data e estou tentando adicionar uma nova coluna de valores booleanos indicando se uma determinada data é feriado ou não. A seguir está o código, mas ele não funciona (todos os valores são ...

1 a resposta

Como adicionar uma subparcela a um grupo de plotagens

Eu tenho um grupo deplots que eu quero exibir comosubplots. Posso adicionar a maioria deles, mas estou lutando para adicionar um em particular. Para o código abaixo, posso adicionar osubplot paraPlot One ePlot Three mas não posso adicionar a ...

1 a resposta

Obter número de linhas antes e depois de um certo valor de índice nos pandas

Digamos que tenho o seguinte: In [1]: import pandas as pd import numpy as np df = pd.DataFrame(data=np.random.rand(11),index=pd.date_range('2015-04-20','2015-04-30'),columns=['A']) Out[1]: A 2015-04-20 0.694983 2015-04-21 0.393851 2015-04-22 ...