Расчет длины 95% -CI с использованием dplyr
В прошлый раз я спросил, как можно рассчитать средний балл за единицу измерения (неделю) для переменной (procras), которая неоднократно измерялась для нескольких респондентов. Таким образом, мой (упрощенный) набор данных в длинном формате выглядит, например, следующим образом (здесь два студента и 5 временных точек, без групповой переменной):
studentID week procras
1 0 1.4
1 6 1.2
1 16 1.6
1 28 NA
1 40 3.8
2 0 1.4
2 6 1.8
2 16 2.0
2 28 2.5
2 40 2.8
Используя dplyr, я бы получил среднюю оценку за единицу измерения
mean_data <- group_by(DataRlong, week)%>% summarise(procras = mean(procras, na.rm = TRUE))
Выглядеть так, например:
Source: local data frame [5 x 2]
occ procras
(dbl) (dbl)
1 0 1.993141
2 6 2.124020
3 16 2.251548
4 28 2.469658
5 40 2.617903
С помощью ggplot2 я теперь мог составить график среднего изменения во времени, и, легко настраивая group_data () dplyr, я также мог получать средства по подгруппам (например, средний балл за случай для мужчин и женщин). Теперь я хотел бы добавить столбец в таблицу mean_data, который включает в себя длину 95% -ных индикаторов около среднего значения для каждого случая.
http://www.cookbook-r.com/Graphs/Plotting_means_and_error_bars_(ggplot2)/ объясняет, как получить и построить CI, но этот подход кажется проблематичным, как только я хотел сделать это для любой подгруппы, верно? Так есть ли способ позволить dplyr также автоматически включать CI (в зависимости от размера группы и т. Д.) В mean_data? После этого должно быть довольно легко отобразить новые значения в виде CI на графиках, я надеюсь. Спасибо.