Коэффициент доверительного интервала R

Я пытаюсь обобщить данные обследования домохозяйств, и поэтому большинство моих данных являются категориальными (факторными) данными. Я хотел обобщить это с помощью графиков частот ответов на определенные вопросы (например, гистограмма процентных долей домохозяйств, отвечающих на определенные вопросы, с ошибками, показывающими доверительные интервалы). Я нашел этот превосходный урок, который, как я думал, был ответом на мои молитвы (http://www.cookbook-r.com/Manipulating_data/Summarizing_data/) но оказывается, что это только поможет с непрерывными данными.

Мне нужно нечто подобное, что позволит мне рассчитать пропорции подсчетов и стандартные ошибки / доверительные интервалы этих пропорций.

По сути, я хочу иметь возможность составлять сводные таблицы, которые выглядят так для каждого из вопросов, заданных в моих данных опроса:

# X5employf X5employff  N(count) proportion SE of prop.  ci of prop
#   1          1        20    0.64516129    ?             ?       
#   1          2         1    0.03225806    ?             ?  
#   1          3         9    0.29032258    ?             ?
#   1          NA        1    0.290322581    ?            ?
#   2          4             1    0.1            ?             ?


structure(list(X5employf = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L), .Label = c("1", "2", "3"), class = "factor"), X5employff = structure(c(1L, 2L, 3L, NA, 4L, 5L, 6L, 7L, 8L, 4L, 5L, 6L, 7L), .Label = c("1", "2", "3", "4", "5", "6", "7", "8"), class = "factor"), count = c(20L, 1L, 9L, 1L, 1L, 5L, 2L, 1L, 1L, 4L, 5L, 4L, 1L)), .Names = c("X5employf", "X5employff", "count"), row.names = c(NA, -13L), class = "data.frame")

Затем я бы хотел построить графики в ggplot (или аналогичные), используя эти сводные данные с ошибками, показывающими доверительные интервалы.

Я думал изменить код, приведенный в учебнике выше, чтобы вычислить столбцы выше, хотя, как относительный новичок в R, я немного борюсь! Я экспериментировал с пакетом ggply, но не очень хорошо разбирался в синтаксисе, поэтому мне удалось продвинуться так далеко с помощью следующего кода:

> X5employ_props <- ddply(X5employ_counts, .(X5employf), transform, prop=count/sum(count))

Но я заканчиваю с этим:

   X5employf X5employff count      prop
1          1          1    20 1.0000000
2          1          2     1 1.0000000
3          1          3     9 1.0000000
4          2          4     1 0.2000000
5          3          4     4 0.8000000
6          2          5     5 0.5000000
7          3          5     5 0.5000000
8          2          6     2 0.3333333
9          3          6     4 0.6666667
10         2          7     1 0.5000000
11         3          7     1 0.5000000
12         2          8     1 1.0000000
13         1       <NA>     1 1.0000000

Со всеми моими пропорциями, равными 1, вероятно потому, что они рассчитываются построки и нетстолбцы

Я задавался вопросом, может ли кто-нибудь помочь или знать о пакетах / коде, который сделает эту работу за меня!

Ответы на вопрос(2)

Ваш ответ на вопрос