Standardfehlerbalken mit stat_summary

Question

Oct 08, 2013, 11:08 PM

Standardfehlerbalken mit stat_summary

Mit dem folgenden Code werden Balkendiagramme mit Standardfehlerbalken unter Verwendung von Hmisc, ddply und ggplot erstellt:

means_se <- ddply(mtcars,.(cyl),
                  function(df) smean.sdl(df$qsec,mult=sqrt(length(df$qsec))^-1))
colnames(means_se) <- c("cyl","mean","lower","upper")
ggplot(means_se,aes(cyl,mean,ymax=upper,ymin=lower,group=1)) + 
  geom_bar(stat="identity") +  
  geom_errorbar()

Die Implementierung der oben genannten Hilfefunktionen wie mean_sdl scheint jedoch viel besser zu sein. Mit dem folgenden Code wird beispielsweise ein Diagramm mit 95% CI-Fehlerbalken erstellt:

ggplot(mtcars, aes(cyl, qsec)) + 
  stat_summary(fun.y = mean, geom = "bar") + 
  stat_summary(fun.data = mean_sdl, geom = "errorbar")

Meine Frage ist, wie man die stat_summary-Implementierung für Standardfehlerbalken verwendet. Das Problem ist, dass zur Berechnung der SE die Anzahl der Beobachtungen pro Bedingung benötigt wird und auf diese im Multiplikator von mean_sdl zugegriffen werden muss.

Wie kann ich innerhalb von ggplot auf diese Informationen zugreifen? Gibt es eine ordentliche, nicht hackige Lösung dafür?

Zu kommentieren