Python Pandas Как назначить результаты групповой операции обратно столбцам в родительском фрейме данных?

У меня есть следующий фрейм данных в IPython, где каждая строка представляет собой одну акцию:

In [261]: bdata
Out[261]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 21210 entries, 0 to 21209
Data columns:
BloombergTicker      21206  non-null values
Company              21210  non-null values
Country              21210  non-null values
MarketCap            21210  non-null values
PriceReturn          21210  non-null values
SEDOL                21210  non-null values
yearmonth            21210  non-null values
dtypes: float64(2), int64(1), object(4)

Я хочу применить групповую операцию, которая вычисляет средневзвешенную доходность по всем показателям для каждой даты в & quot; yearmonth & quot; колонка.

Это работает как ожидалось:

In [262]: bdata.groupby("yearmonth").apply(lambda x: (x["PriceReturn"]*x["MarketCap"]/x["MarketCap"].sum()).sum())
Out[262]:
yearmonth
201204      -0.109444
201205      -0.290546

Но тогда я хочу что-то вроде «трансляции» эти значения возвращаются к индексам в исходном фрейме данных и сохраняются в виде постоянных столбцов, в которых совпадают даты.

In [263]: dateGrps = bdata.groupby("yearmonth")

In [264]: dateGrps["MarketReturn"] = dateGrps.apply(lambda x: (x["PriceReturn"]*x["MarketCap"]/x["MarketCap"].sum()).sum())
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
/mnt/bos-devrnd04/usr6/home/espears/ws/Research/Projects/python-util/src/util/<ipython-input-264-4a68c8782426> in <module>()
----> 1 dateGrps["MarketReturn"] = dateGrps.apply(lambda x: (x["PriceReturn"]*x["MarketCap"]/x["MarketCap"].sum()).sum())

TypeError: 'DataFrameGroupBy' object does not support item assignment

Я понимаю, что это наивное задание не должно работать. Но что является «правильным»? Pandas идиома для назначения результата операции groupby в новый столбец на родительском фрейме данных?

В конце я хочу столбец с именем «MarketReturn» чем будет повторное постоянное значение для всех индексов, которые имеют дату совпадения с выходными данными операции группировки.

Один из способов добиться этого был бы следующим:

marketRetsByDate  = dateGrps.apply(lambda x: (x["PriceReturn"]*x["MarketCap"]/x["MarketCap"].sum()).sum())

bdata["MarketReturn"] = np.repeat(np.NaN, len(bdata))

for elem in marketRetsByDate.index.values:
    bdata["MarketReturn"][bdata["yearmonth"]==elem] = marketRetsByDate.ix[elem]

Но это медленно, плохо и не пифонично.

Ответы на вопрос(5)

Ваш ответ на вопрос