Média de execução R para dados não horários
Este é o enredo que estou tendo agora.
É gerado a partir deste código:
ggplot(data1, aes(x=POS,y=DIFF,colour=GT)) +
geom_point() +
facet_grid(~ CHROM,scales="free_x",space="free_x") +
theme(strip.text.x = element_text(size=40),
strip.background = element_rect(color='lightblue',fill='lightblue'),
legend.position="top",
legend.title = element_text(size=40,colour="lightblue"),
legend.text = element_text(size=40),
legend.key.size = unit(2.5, "cm")) +
guides(fill = guide_legend(title.position="top",
title = "Legend:GT='REF'+'ALT'"),
shape = guide_legend(override.aes=list(size=10))) +
scale_y_log10(breaks=trans_breaks("log10", function(x) 10^x, n=10)) +
scale_x_continuous(breaks = pretty_breaks(n=3)) +
geom_line(stat = "hline",
yintercept = "mean",
size = 1)
A última linha, geom_line, cria a linha média para cada painel.
Mas agora eu quero ter a média de execução mais específica dentro de cada painel.
ou seja, se o painel1 ('chr01') tiver um intervalo de eixo x de 0 a 100.000.000, eu gostaria de ter o valor médio para cada 1.000.000 de intervalo.
mean1 = mean (x = 0 ex = 1.000.000)
mean2 = mean (x = 1.000.001 ex = 2.000.000)
Curtiu isso.