Ordenar pilhas por tamanho em um gráfico de barras empilhadas ggplot2
Então, tenho uma carga de dados que amostramos como exemplo abaixo:
Sequence Abundance Length
CAGTG 3 25
CGCTG 82 23
GGGAC 4 25
CTATC 16 23
CTTGA 14 25
CAAGG 9 24
GTAAT 5 24
ACGAA 32 22
TCGGA 10 22
TAGGC 30 21
TGCCG 25 21
TCCGG 2 21
CGCCT 22 24
TTGGC 4 22
ATTCC 4 23
Estou apenas mostrando as 4 primeiras palavras de cada sequência aqui, mas, na realidade, elas são longas. Eu estou olhando para a abundância de sequências para cada classe de tamanho que tenho aqui. Além disso, quero visualizar a proporção de abundância que uma sequência específica representa dentro de sua classe de tamanho. Atualmente, eu posso criar um gráfico de barras empilhadas como este:
ggplot(tab, aes(x=Length, y=Abundance, fill=Sequence))
+ geom_bar(stat='identity')
+ opts(legend.position="none")
Isso é bom para um pequeno conjunto de dados como esse, mas tenho cerca de 1,7 milhão de linhas no meu conjunto de dados real. Parece muito colorido e posso ver que seqüências específicas possuem uma maioria maioritária em uma classe de tamanho único, mas é muito confus
Gostaria de poder encomendar as barras empilhadas coloridas para cada tamanho de acordo com a abundância dessa sequência. ou seja, as barras com a maior abundância dentro de sua pilha estão na parte inferior de cada pilha e as barras com a menor abundância estão na parte superior. Deve parecer muito mais apresentável dessa maneira.
Alguma idéia de como fazer isso no ggplot2? Sei que há um parâmetro "order" no aes (), mas não consigo descobrir o que ele deve fazer com os dados no formato que tenho.