Resultados da pesquisa a pedido "pandas"

4 a resposta

Aplique estilos ao exportar para 'xlsx' em pandas com o XlsxWriter

Eu uso o método .to_excel dos pandas para escrever um DataFrame como uma pasta de trabalho do Excel. Isso funciona bem mesmo para DataFrames com vários índices à medida que as células de índice são mescladas. Ao usar o XlsxWriter puro, posso ...

6 a resposta

panda ValueError: numpy.dtype tem o tamanho errado, tente recompilar

Fiz uma nova instalação limpa do OSX 10.9.3 e instalei o pip e, em seguida, pip install pandas pip install numpyAmbas as instalações pareciam perfeitamente felizes e funcionavam sem erros (embora houvesse um zilhão de avisos). Quando tentei ...

2 a resposta

Retornando grupos de colunas correlacionadas no quadro de dados do pandas

Eu corri uma matriz de correlação em umpandas DataFrame: df=pd.DataFrame( {'one':[0.1, .32, .2, 0.4, 0.8], 'two':[.23, .18, .56, .61, .12], 'three':[.9, .3, .6, .5, .3], 'four':[.34, .75, .91, .19, .21], 'zive': [0.1, .32, .2, 0.4, 0.8], ...

2 a resposta

Pandas - converte multi-índice de dataframe em objeto de data e hora

Considere um arquivo de entrada,b.dat: string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 ...

1 a resposta

Python Pandas: obter linha por valor mediano

Estou tentando obter a linha do valor mediano para uma coluna. Estou usando data.median () para obter o valor mediano para 'column'. id 30444.5 someProperty 3.0 numberOfItems 0.0 column 70.0E data.median () ['column'] é ...

17 a resposta

Como crio amostras de teste e treinamento de um quadro de dados com pandas?

Eu tenho um conjunto de dados bastante grande na forma de um quadro de dados e queria saber como seria capaz de dividir o quadro de dados em duas amostras aleatórias (80% e 20%) para treinamento e teste. Obrigado!

1 a resposta

Analisando arquivo CSV em pandas com vírgulas na última coluna

Estou com alguns dados CSV mal formatados que preciso ler em um dataframe do Pandas. Não posso mudar a maneira como os dados estão sendo gravados (eles vêm de outro lugar); portanto, não há soluções sugerindo isso. A maioria dos dados está ...

2 a resposta

pandas: classifique cada coluna individualmente

Meu dataframe se parece com isso, só que muito maior. d = {'Col_1' : pd.Series(['A', 'B']), 'Col_2' : pd.Series(['B', 'A', 'C']), 'Col_3' : pd.Series(['B', 'A']), 'Col_4' : pd.Series(['C', 'A', 'B', 'D']), 'Col_5' : pd.Series(['A', 'C']),} df = ...

8 a resposta

Gerando datas aleatórias dentro de um determinado intervalo em pandas

Esta é uma postagem auto-respondida. Um problema comum é gerar datas aleatoriamente entre uma determinada data de início e término. Há dois casos a serem considerados: datas aleatórias com um componente de tempo edatas aleatórias sem ...

3 a resposta

Pandas: Bar-Plot com duas barras e dois eixos y

Eu tenho um DataFrame parecido com este: amount price age A 40929 4066443 B 93904 9611272 C 188349 19360005 D 248438 24335536 E 205622 18888604 F 140173 12580900 G 76243 6751731 H 36859 3418329 I 29304 2758928 J 39768 3201269 K 30350 ...