Expanda dados desbalanceados para o painel mensal
Eu tenho um conjunto de dados que se parece com o seguinte que eu gostaria de expandir para um conjunto de dados de painel mensal.
<code>ID | start_date | end_date | event_type | 1 | 01/01/97 | 08/01/98 | 1 | 2 | 02/01/97 | 10/01/97 | 1 | 3 | 01/01/96 | 12/01/04 | 2 | </code>
Alguns casos duram mais que outros. Eu descobri como expandir os dados para uma configuração anual, retirando o ano de cada data e, em seguida, usando:
<code>year <- ddply(df, c("ID"), summarize, year = seq(startyear, endyear)) </code>
Seguido por:
<code>month <- ddply(year, c("ID"), summarize, month = seq(1, 12)) </code>
O problema com essa abordagem é que ela não atribui o número correto para o mês, ou seja, janeiro = 1, e por isso não funciona bem com um conjunto de dados de evento com o qual gostaria de mesclá-lo, onde gostaria estar combinandoyear
, ID
emonth
. Ajuda seria apreciada. Aqui está um link direto para o conjunto de dados que estou tentando expandir (.xls):http://db.tt/KeLRCzr9. Espero ter incluído informações suficientes, mas, por favor, deixe-me saber se há alguma outra informação necessária.