ddply для суммы по группе в R
У меня есть образец данных "данные" следующее:
X Y Month Year income
2281205 228120 3 2011 1000
2281212 228121 9 2010 1100
2281213 228121 12 2010 900
2281214 228121 3 2011 9000
2281222 228122 6 2010 1111
2281223 228122 9 2010 3000
2281224 228122 12 2010 1889
2281225 228122 3 2011 778
2281243 228124 12 2010 1111
2281244 228124 3 2011 200
2281282 228128 9 2010 7889
2281283 228128 12 2010 2900
2281284 228128 3 2011 3400
2281302 228130 9 2010 1200
2281303 228130 12 2010 2000
2281304 228130 3 2011 1900
2281352 228135 9 2010 2300
2281353 228135 12 2010 1333
2281354 228135 3 2011 2340
Я хочу использоватьddply
рассчитать доход для каждогоY
(неX
), если у меня есть четыре наблюдения для каждого Y (например, для 2281223 с 6,9,12 месяцами 2010 года и 3 месяцами 2011 года). Если у меня меньше четырех наблюдений (например, для Y = 228130), я хочу просто проигнорировать это. Я использую следующие команды вR
для вышеуказанной цели:
require(plyr)
# the data are in the data csv file
data