R Barchart empilhado com dados agregados
Estou tendo problemas para criar um gráfico de barras empilhado com dados agregados. Ao lidar com tabelas agregadas de relatórios de outras pessoas, geralmente uso o Excel, mas gostaria de começar a fazer todos os meus gráficos em R, possivelmente com lattice ou ggplot. No Excel, um gráfico de barras empilhado dos seguintes dados agregados leva alguns cliques (Inserir, Gráficos de Colunas, Colunas Empilhadas) e você obtém algo assim..
Além de querer este gráfico em R eu também quero usar facetagem de ggplot, ou seja. coloquei dois baralhos empilhados lado a lado em ggplot para comparar dois grupos (A e B). Eu brinquei com outros gráficos e esta parece ser a melhor escolha. Esses são os dados. O gráfico do Excel mostra apenas o grupo A (os números são porcentagens).
D<-as.data.frame(structure(list(Group = c("A", "A", "A", "A", "A",
"A", "B", "B", "B", "B", "B", "B"
), Education = c("NVQ Level 4 and above", "NVQ Level3", "NVQ Level 2",
"Below NVQ Level 2", "Other qualification", "No qualification",
"NVQ Level 4 and above", "NVQ Level3", "NVQ Level 2", "Below NVQ Level 2",
"Other qualification", "No qualification"), Full.Time = c(47,
27, 23, 17, 18, 9, 36, 26, 22, 22, 27, 12), PT.16.hours = c(20,
24, 22, 18, 18, 12, 22, 21, 21, 22, 14, 10), PT.16.hours.1 = c(12,
11, 10, 11, 13, 5, 24, 25, 25, 20, 16, 12)), .Names = c("Group",
"Education", "Full.Time", "PT>16.hours", "PT<16.hours")))
Antes de começar a lapidação para mostrar a diferença nos dois grupos, estou realmente tendo problemas para criar um único gráfico de barras empilhadas (como o acima) com ggplot2. Eu estou supondo que eu não deveria ter 3 variáveis (FullTime, PT, PT> 16 horas), mas sim linhas simples para cada caso, então ao invés de ter
A NVQ Level 4 and above 47 20 12
A NVQ Level3 27 24 11
eu deveria ter
Group Education Work Percentage
A NVQ Level 4 and above Full Time 47
A NVQ Level 4 and above PT>16 hours 20
Se essa é a única maneira de fazer com que o ggplot faça o gráfico, como você mudaria de um formato para outro com algumas linhas de código? Geralmente, encontro esse tipo de dados para que seja bom ter um procedimento padronizado. Eu também brinquei com a opção 'identidade' do ggplot, mas não tive muito sucesso.
Qualquer ajuda seria muito apreciada.
obrigado