Estatísticas de resumo usando ddply
Eu gosto de escrever uma função usandoddply
que gera as estatísticas de resumo com base no nome de duas colunas dedata.frame
mat
.
mat
é um grandedata.frame
com o nome das colunas"metric", "length", "species", "tree", ...,"index"
index
é um fator com 2 níveis"Short", "Long"
"metric", "length", "species", "tree"
e outros são todas variáveis contínuas
Função
summary1 <- function(arg1,arg2) {
...
ss <- ddply(mat, .(index), function(X) data.frame(
arg1 = as.list(summary(X$arg1)),
arg2 = as.list(summary(X$arg2)),
.parallel = FALSE)
ss
}
Espero que a saída fique assim depois de chamarsummary1("metric","length")
Short metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.
....
Long metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.
....
No momento em que a função não produz a saída desejada? Que modificação deve ser feita aqui?
Obrigado pela ajuda
Aqui está um exemplo de brinquedo
mat <- data.frame(
metric = rpois(10,10), length = rpois(10,10), species = rpois(10,10),
tree = rpois(10,10), index = c(rep("Short",5),rep("Long",5))
)