ggplot2 boxplot медианы не строят, как ожидалось
Итак, у меня есть довольно большой набор данных(Dropbox: CSV-файл) что я пытаюсь построить с помощьюgeom_boxplot
, Следующее производит то, что кажется разумным сюжетом:
require(reshape2)
require(ggplot2)
require(scales)
require(grid)
require(gridExtra)
df <- read.csv("\\Downloads\\boxplot.csv", na.strings = "*")
df$year <- factor(df$year, levels = c(2010,2011,2012,2013,2014), labels = c(2010,2011,2012,2013,2014))
d <- ggplot(data = df, aes(x = year, y = value)) +
geom_boxplot(aes(fill = station)) +
facet_grid(station~.) +
scale_y_continuous(limits = c(0, 15)) +
theme(legend.position = "none"))
d
Тем не менее, когда вы копаете немного глубже, проблемы закрадываются, что пугает меня. Когда я пометил медианы коробки с их значениями, получился следующий график.
df.m <- aggregate(value~year+station, data = df, FUN = function(x) median(x))
d <- d + geom_text(data = df.m, aes(x = year, y = value, label = value))
d
Медианы, построенные с помощью geom_boxplot, вообще не совпадают с медианами. Метки нанесены при правильном значении оси Y, но средний шарнир коробочных диаграмм определенно не соответствует медиане. Я был озадачен этим несколько дней назад.
Что является причиной этого? Как можно получить этот тип отображения с правильными медианами? Как этот сюжет может быть отлажен или диагностирован?