Dołącz kolumnę obliczeniową do istniejącej ramki danych

Question

Dec 23, 2013, 07:03 AM

Dołącz kolumnę obliczeniową do istniejącej ramki danych

Zaczynam się uczyć Pandy i śledziłem to pytanietutaj i nie mogłem uzyskać rozwiązania, które zaproponowałoby mi działanie, i otrzymałem błąd indeksowania. To jest to, co mam

from pandas import *
import pandas as pd
d = {'L1' : Series(['X','X','Z','X','Z','Y','Z','Y','Y',]),
     'L2' : Series([1,2,1,3,2,1,3,2,3]),
     'L3' : Series([50,100,15,200,10,1,20,10,100])}
df = DataFrame(d)  
df.groupby('L1', as_index=False).apply(lambda x : pd.expanding_sum(x.sort('L3', ascending=False)['L3'])/x['L3'].sum())

który wyświetla następujące dane (używam iPython)

L1   
X   3    0.571429
    1    0.857143
    0    1.000000
Y   8    0.900901
    7    0.990991
    5    1.000000
Z   6    0.444444
    2    0.777778
    4    1.000000
dtype: float64

Następnie staram się dołączyć skumulowaną liczbę obliczeń pod etykietą „nowy” zgodnie z sugestią podaną w poście

df["new"] = df.groupby("L1", as_index=False).apply(lambda x : pd.expanding_sum(x.sort("L3", ascending=False)["L3"])/x["L3"].sum())

Rozumiem:

   2196                         value = value.reindex(self.index).values
   2197                     except:
-> 2198                         raise TypeError('incompatible index of inserted column '
   2199                                         'with frame index')
   2200 
TypeError: incompatible index of inserted column with frame index

Czy ktoś wie, w czym tkwi problem? Jak mogę ponownie wstawić obliczoną wartość do ramki danych, aby pokazywała wartości w porządku (malejące przez „nowe” dla każdej etykiety X, Y, Z.)