Resultados da pesquisa a pedido "pandas"
Pandas: subtrai a média da linha de cada elemento da linha
Eu tenho um quadro de dados com linhas indexadas por tipo de elemento químico e colunas representando amostras diferentes. Os valores são flutuantes representando o grau de presença do elemento de linha em cada amostra. Eu quero calcular a média ...
Normalizar DataFrame por grupo
Digamos que eu tenha alguns dados gerados da seguinte maneira: N = 20 m = 3 data = np.random.normal(size=(N,m)) + np.random.normal(size=(N,m))**3e então eu crio alguma variável de categorização: indx = ...
plotar cores diferentes para diferentes níveis categóricos usando o matplotlib
Eu tenho esse quadro de dadosdiamonds que é composto de variáveis como(carat, price, color)e quero desenhar um gráfico de dispersão deprice paracarat para cadacolor, o que significa diferentecolor tem cor diferente na trama. Isso é fácil emR ...
Python: algoritmo mediano ponderado com pandas
Eu tenho um quadro de dados que se parece com isso: Out[14]: impwealth indweight 16 180000 34.200 21 384000 37.800 26 342000 39.715 30 1154000 44.375 31 421300 44.375 32 1210000 45.295 33 1062500 45.295 34 1878000 46.653 35 876000 46.653 36 ...
Agregação de pandas ignorando NaNs
Agrego meu dataframe do Pandas:data. Especificamente, quero obter a média e somaamounts por tuplas de [origin etype] Para calcular a média e somar, tentei as funções numpy abaixo: import numpy as np import pandas as pd result ...
Renomear dataframe de pandas de coluna sem nome
Meu arquivo CSV não tem um nome de coluna para a primeira coluna e quero renomeá-lo. Normalmente, eu fariadata.rename(columns={'oldname':'newname'}, inplace=True), mas não há nome no arquivo csv, apenas ''.
Python 3 - Zip é um iterador em um dataframe de pandas
Eu estou seguindo oTutoriais sobre pandas [http://nbviewer.ipython.org/urls/bitbucket.org/hrojas/learn-pandas/raw/master/lessons/01%20-%20Lesson.ipynb] Os tutoriais são escritos usando o python 2.7 e eu os faço no python 3.4 Aqui estão os ...
Converta a linha no cabeçalho da coluna do Pandas DataFrame,
Os dados com os quais tenho que trabalhar são um pouco confusos. Ele tem nomes de cabeçalho dentro dos dados. Como posso escolher uma linha de um dataframe de pandas existente e torná-la (renomeá-la para) como um cabeçalho de coluna? Eu quero ...
Converter pandas.groupby em dict
Considere, dataframed: d = pd.DataFrame({'a': [0, 2, 1, 1, 1, 1, 1], 'b': [2, 1, 0, 1, 0, 0, 2], 'c': [1, 0, 2, 1, 0, 2, 2]} > a b c 0 0 2 1 1 2 1 0 2 1 0 2 3 1 1 1 4 1 0 0 5 1 0 2 6 1 2 2Quero dividi-lo por colunaa no dicionário assim: {0: a b ...
Como redefinir cumsum após alteração no sinal de valores?
In [46]: d = np.random.randn(10, 1) * 2 In [47]: df = pd.DataFrame(d.astype(int), columns=['data'])Estou tentando criar uma coluna cumsum onde ela deve redefinir após uma alteração de sinal na coluna de dados, como esta data custom_cumsum 0 -2 ...