Estadísticas de resumen usando ddply
Me gusta escribir una función usandoddply
que genera las estadísticas de resumen basadas en el nombre de dos columnas dedata.frame
mat
.
mat
es un grandedata.frame
con el nombre de las columnas"metric", "length", "species", "tree", ...,"index"
index
es factor con 2 niveles"Short", "Long"
"metric", "length", "species", "tree"
y otros son variables continuas
Función
summary1 <- function(arg1,arg2) {
...
ss <- ddply(mat, .(index), function(X) data.frame(
arg1 = as.list(summary(X$arg1)),
arg2 = as.list(summary(X$arg2)),
.parallel = FALSE)
ss
}
Espero que la salida se vea así después de llamar asummary1("metric","length")
Short metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.
....
Long metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.
....
¿En este momento la función no produce la salida deseada? ¿Qué modificación se debe hacer aquí?
Gracias por tu ayuda
Aquí hay un ejemplo de juguete
mat <- data.frame(
metric = rpois(10,10), length = rpois(10,10), species = rpois(10,10),
tree = rpois(10,10), index = c(rep("Short",5),rep("Long",5))
)