«Поддельные данные» должны были показать его структуру, а не реальный, содержательный пример. Тем не менее, процент - это хитрый трюк, который хорошо работает в моем реальном примере, так что спасибо!
могу создать гистограмму, в которой значение X исходит из нескольких значений фрейма данных?
Поддельные данные:
data <- data.frame(col1 = rep(c("A", "B", "C", "B", "C", "A", "A", "B", "B", "A", "C")),
col2 = rep(c(2012, 2012, 2012, 2013, 2013, 2014, 2014, 2014, 2015, 2015, 2015)),
col3 = rep(c("Up", "Down", "Up", "Up", "Down", "Left", "Right", "Up", "Right", "Down", "Up")),
col4 = rep(c("Y", "N", "N", "N", "Y", "N", "Y", "Y", "Y", "N", "Y")))
То, что я пытаюсь сделать, это построить число (в идеале, процент)Y
иN
вcol4
на основе сгруппированы поcol1
, col2
, а такжеcol3
.
В целом, если есть 50 строк и 25 строк имеютY
Я должен быть в состоянии сделать график, который выглядит следующим образом:
Я знаю, что основной барплот с ggplot это:
ggplot(data, aes(x = col1, fil = col4)) + geom_bar()
Я не ищу сколькоcol4
найден заcol3
поcol2
Впрочем, такfacet_wrap()
Я думаю, это не уловка, но я не знаю, что делать вместо этого.