Como é possível agregar e resumir dados rapidament
Tenho um conjunto de dados cujos cabeçalhos são assim:
PID Time Site Rep Count
Quero somar oCount
porRep
para cadaPID x Time x Site combo
no data.frame resultante, quero obter o valor médio deCount
paraPID x Time x Site
combo.
A função atual é a seguinte:
dummy <- function (data)
{
A<-aggregate(Count~PID+Time+Site+Rep,data=data,function(x){sum(na.omit(x))})
B<-aggregate(Count~PID+Time+Site,data=A,mean)
return (B)
}
Isso é dolorosamente lento (data.frame original é510000 20)
. Existe uma maneira de acelerar isso com plyr?