Resultados da pesquisa a pedido "pandas"
Aplique estilos ao exportar para 'xlsx' em pandas com o XlsxWriter
Eu uso o método .to_excel dos pandas para escrever um DataFrame como uma pasta de trabalho do Excel. Isso funciona bem mesmo para DataFrames com vários índices à medida que as células de índice são mescladas. Ao usar o XlsxWriter puro, posso ...
panda ValueError: numpy.dtype tem o tamanho errado, tente recompilar
Fiz uma nova instalação limpa do OSX 10.9.3 e instalei o pip e, em seguida, pip install pandas pip install numpyAmbas as instalações pareciam perfeitamente felizes e funcionavam sem erros (embora houvesse um zilhão de avisos). Quando tentei ...
Retornando grupos de colunas correlacionadas no quadro de dados do pandas
Eu corri uma matriz de correlação em umpandas DataFrame: df=pd.DataFrame( {'one':[0.1, .32, .2, 0.4, 0.8], 'two':[.23, .18, .56, .61, .12], 'three':[.9, .3, .6, .5, .3], 'four':[.34, .75, .91, .19, .21], 'zive': [0.1, .32, .2, 0.4, 0.8], ...
Pandas - converte multi-índice de dataframe em objeto de data e hora
Considere um arquivo de entrada,b.dat: string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 ...
Python Pandas: obter linha por valor mediano
Estou tentando obter a linha do valor mediano para uma coluna. Estou usando data.median () para obter o valor mediano para 'column'. id 30444.5 someProperty 3.0 numberOfItems 0.0 column 70.0E data.median () ['column'] é ...
Como crio amostras de teste e treinamento de um quadro de dados com pandas?
Eu tenho um conjunto de dados bastante grande na forma de um quadro de dados e queria saber como seria capaz de dividir o quadro de dados em duas amostras aleatórias (80% e 20%) para treinamento e teste. Obrigado!
Analisando arquivo CSV em pandas com vírgulas na última coluna
Estou com alguns dados CSV mal formatados que preciso ler em um dataframe do Pandas. Não posso mudar a maneira como os dados estão sendo gravados (eles vêm de outro lugar); portanto, não há soluções sugerindo isso. A maioria dos dados está ...
pandas: classifique cada coluna individualmente
Meu dataframe se parece com isso, só que muito maior. d = {'Col_1' : pd.Series(['A', 'B']), 'Col_2' : pd.Series(['B', 'A', 'C']), 'Col_3' : pd.Series(['B', 'A']), 'Col_4' : pd.Series(['C', 'A', 'B', 'D']), 'Col_5' : pd.Series(['A', 'C']),} df = ...
Gerando datas aleatórias dentro de um determinado intervalo em pandas
Esta é uma postagem auto-respondida. Um problema comum é gerar datas aleatoriamente entre uma determinada data de início e término. Há dois casos a serem considerados: datas aleatórias com um componente de tempo edatas aleatórias sem ...
Pandas: Bar-Plot com duas barras e dois eixos y
Eu tenho um DataFrame parecido com este: amount price age A 40929 4066443 B 93904 9611272 C 188349 19360005 D 248438 24335536 E 205622 18888604 F 140173 12580900 G 76243 6751731 H 36859 3418329 I 29304 2758928 J 39768 3201269 K 30350 ...