Resultados da pesquisa a pedido "pandas"

2 a resposta

Pandas: subtrai a média da linha de cada elemento da linha

Eu tenho um quadro de dados com linhas indexadas por tipo de elemento químico e colunas representando amostras diferentes. Os valores são flutuantes representando o grau de presença do elemento de linha em cada amostra. Eu quero calcular a média ...

4 a resposta

Normalizar DataFrame por grupo

Digamos que eu tenha alguns dados gerados da seguinte maneira: N = 20 m = 3 data = np.random.normal(size=(N,m)) + np.random.normal(size=(N,m))**3e então eu crio alguma variável de categorização: indx = ...

4 a resposta

plotar cores diferentes para diferentes níveis categóricos usando o matplotlib

Eu tenho esse quadro de dadosdiamonds que é composto de variáveis como(carat, price, color)e quero desenhar um gráfico de dispersão deprice paracarat para cadacolor, o que significa diferentecolor tem cor diferente na trama. Isso é fácil emR ...

3 a resposta

Python: algoritmo mediano ponderado com pandas

Eu tenho um quadro de dados que se parece com isso: Out[14]: impwealth indweight 16 180000 34.200 21 384000 37.800 26 342000 39.715 30 1154000 44.375 31 421300 44.375 32 1210000 45.295 33 1062500 45.295 34 1878000 46.653 35 876000 46.653 36 ...

1 a resposta

Agregação de pandas ignorando NaNs

Agrego meu dataframe do Pandas:data. Especificamente, quero obter a média e somaamounts por tuplas de [origin etype] Para calcular a média e somar, tentei as funções numpy abaixo: import numpy as np import pandas as pd result ...

4 a resposta

Renomear dataframe de pandas de coluna sem nome

Meu arquivo CSV não tem um nome de coluna para a primeira coluna e quero renomeá-lo. Normalmente, eu fariadata.rename(columns={'oldname':'newname'}, inplace=True), mas não há nome no arquivo csv, apenas ''.

1 a resposta

Python 3 - Zip é um iterador em um dataframe de pandas

Eu estou seguindo oTutoriais sobre pandas [http://nbviewer.ipython.org/urls/bitbucket.org/hrojas/learn-pandas/raw/master/lessons/01%20-%20Lesson.ipynb] Os tutoriais são escritos usando o python 2.7 e eu os faço no python 3.4 Aqui estão os ...

4 a resposta

Converta a linha no cabeçalho da coluna do Pandas DataFrame,

Os dados com os quais tenho que trabalhar são um pouco confusos. Ele tem nomes de cabeçalho dentro dos dados. Como posso escolher uma linha de um dataframe de pandas existente e torná-la (renomeá-la para) como um cabeçalho de coluna? Eu quero ...

1 a resposta

Converter pandas.groupby em dict

Considere, dataframed: d = pd.DataFrame({'a': [0, 2, 1, 1, 1, 1, 1], 'b': [2, 1, 0, 1, 0, 0, 2], 'c': [1, 0, 2, 1, 0, 2, 2]} > a b c 0 0 2 1 1 2 1 0 2 1 0 2 3 1 1 1 4 1 0 0 5 1 0 2 6 1 2 2Quero dividi-lo por colunaa no dicionário assim: {0: a b ...

1 a resposta

Como redefinir cumsum após alteração no sinal de valores?

In [46]: d = np.random.randn(10, 1) * 2 In [47]: df = pd.DataFrame(d.astype(int), columns=['data'])Estou tentando criar uma coluna cumsum onde ela deve redefinir após uma alteração de sinal na coluna de dados, como esta data custom_cumsum 0 -2 ...