transformação de log ggplot2 para dados e escalas
Este é um acompanhamento da minha pergunta anteriorIntegrando ggplot2 com stat_function () definido pelo usuário, que eu respondi ontem. Meu atualproblema é que, no exemplo reproduzível a seguir, linhas que deveriam plotarcomponentes dos valores dos dados 'distribuição da mistura, não aparecem nos locais esperados nem na forma esperada, conforme mostrado abaixo (veja as linhas vermelhas em y = 0 na segunda figura).
Completoexemplo reproduzível:
library(ggplot2)
library(scales)
library(RColorBrewer)
library(mixtools)
NUM_COMPONENTS <- 2
set.seed(12345) # for reproducibility
data(diamonds, package='ggplot2') # use built-in data
myData <- diamonds$price
# extract 'k' components from mixed distribution 'data'
mix.info <- normalmixEM(myData, k = NUM_COMPONENTS,
maxit = 100, epsilon = 0.01)
summary(mix.info)
numComponents <- length(mix.info$sigma)
message("Extracted number of component distributions: ",
numComponents)
calc.components <- function(x, mix, comp.number) {
mix$lambda[comp.number] *
dnorm(x, mean = mix$mu[comp.number], sd = mix$sigma[comp.number])
}
g <- ggplot(data.frame(x = myData)) +
scale_fill_continuous("Count", low="#56B1F7", high="#132B43") +
scale_x_log10("Diamond Price [log10]",
breaks = trans_breaks("log10", function(x) 10^x),
labels = prettyNum) +
scale_y_continuous("Count") +
geom_histogram(aes(x = myData, fill = 0.01 * ..density..),
binwidth = 0.01)
print(g)
# we could select needed number of colors randomly:
#DISTRIB_COLORS <- sample(colors(), numComponents)
# or, better, use a palette with more color differentiation:
DISTRIB_COLORS <- brewer.pal(numComponents, "Set1")
distComps <- lapply(seq(numComponents), function(i)
stat_function(fun = calc.components,
arg = list(mix = mix.info, comp.number = i),
geom = "line", # use alpha=.5 for "polygon"
size = 1,
color = "red")) # DISTRIB_COLORS[i]
print(g + distComps)
ATUALIZAR: Apenas uma nota rápida sobre meus esforços. Além disso, tentei várias outras opções, incluindo a conversão da escala do eixo x do gráfico emnormal e solicitando valores de dados originais 'transformação de log na parte do histograma, assim:geom_histogram(aes(x = log10(data), fill = ..count..), binwidth = 0.01)
, mas o resultado final ainda permanece o mesmo. Em relação ao meu primeiro comentário, percebi que a transformação que mencionei não é necessária, desde que eu esteja usando referência ao objeto ..count ..
ATUALIZAÇÃO 2: Cor da linha alterada, produzida porstat_function()
, para vermelho, para esclarecer o problema.