Resultados da pesquisa a pedido "pandas"
Crie um novo quadro de dados em pandas com nomes dinâmicos e adicione uma nova coluna
Eu tenho um dataframe df df = pd.DataFrame({'A':['-a',1,'a'], 'B':['a',np.nan,'c'], 'ID':[1,2,2], 't':[pd.tslib.Timestamp.now(),pd.tslib.Timestamp.now(), np.nan]})Adicionada uma nova coluna df['YearMonth'] = df['t'].map(lambda x: 100*x.year + ...
Python Pandas converte o tipo de dados da coluna
Sei que uma pergunta como essa já foi feita com zilhões de tipos, mas até agora não consegui encontrar uma resposta para essa pergunta. Associei dois arquivos .csv ao Pandas e agora gostaria de adicionar mais algumas colunas ao novo arquivo .csv ...
Recuperar lista de nomes de recursos de treinamento do classificador
Existe uma maneira de recuperar a lista de nomes de recursos usados para o treinamento de um classificador, depois que ele foi treinado com ofit método? Gostaria de obter essas informações antes de aplicar a dados invisíveis. Os dados usados para ...
Converta todo o quadro de dados de minúsculas para maiúsculas com o Pandas
Eu tenho um quadro de dados como o exibido abaixo: # Create an example dataframe about a fictional army raw_data = {'regiment': ['Nighthawks', 'Nighthawks', 'Nighthawks', 'Nighthawks'], 'company': ['1st', '1st', '2nd', '2nd'], 'deaths': ['kkk', ...
Como dividir elementos de uma série de pandas e colocá-los no formato JSON?
Eu tenho um objeto de série pandas S, alguns elementos são pares nome-valor, como a-12 b-23 c-42 d-25 ... alguns são apenas um b c d .... assim por diante, o que preciso fazer é colocar isso no formato Json como: {Name:a,Value:12} ...
Como iterar sobre o dataframe do pandas e criar uma nova coluna
Eu tenho um dataframe de pandas que tem 2 colunas. Eu quero fazer um loop através de suas linhas e, com base em uma string da coluna 2, gostaria de adicionar uma string em uma 3ª coluna recém-criada. Eu tentei: for i in df.index: if ...
TypeError: não é possível multiplicar a sequência por não-int do tipo 'float' (python 2.7)
Eu tenho um quadro de dadost_unit, que é o resultado de umapd.read_csv() função. datetime B18_LR_T B18_B1_T 24/03/2016 09:00 21.274 21.179 24/03/2016 10:00 19.987 19.868 24/03/2016 11:00 21.632 21.417 24/03/2016 12:00 26.285 24.779 24/03/2016 ...
colorir células no excel com pandas
Preciso de ajuda aqui. Então, eu tenho algo parecido com isto import pandas as pd path = '/Users/arronteb/Desktop/excel/ejemplo.xlsx' xlsx = pd.ExcelFile(path) df = pd.read_excel(xlsx,'Sheet1') df['is_duplicated'] = df.duplicated('#CSR') ...
Obter nomes de colunas para valores máximos em uma determinada linha em um DataFrame do pandas
No DataFrame import pandas as pd df=pd.DataFrame({'col1':[1,2,3],'col2':[3,2,1],'col3':[1,1,1]},index= ['row1','row2','row3']) print df col1 col2 col3 row1 1 3 1 row2 2 2 1 row3 3 1 1 Quero obter os nomes das colunas das células com o (s) valor ...
Por que o np.where é mais rápido que o pd.apply
O código de amostra está aqui import pandas as pd import numpy as np df = pd.DataFrame({'Customer' : ['Bob', 'Ken', 'Steve', 'Joe'], 'Spending' : [130,22,313,46]}) #[400000 rows x 4 columns] df = pd.concat([df]*100000).reset_index(drop=True) In ...