Gęstość wykresu i funkcja gęstości skumulowanej na jednym połączonym wykresie przy użyciu ggplot2
Chciałbym uzyskać wykres łączący gęstość obserwacji i cdf.
Zwykłym problemem jest to, że skale tych dwóch są daleko. Jak można temu zaradzić, tj. Użyć dwóch skal lub alternatywnie przeskalować jedną z serii danych (najlepiej w ggplot, jak chciałbym oddzielić obliczenia i wyświetlanie danych).
Oto kod do tej pory:
>dput(tmp)
plony
structure(list(drivenkm = c(8, 11, 21, 4, 594, 179, 19, 7, 10, 36)), .Names = "drivenkm", class = c("data.table", "data.frame" ), row.names = c(NA, -10L), .internal.selfref = <pointer: 0x223cb78>)
wtedy to robię
p = ggplot(data = tmp, aes(x = drivenkm)) + geom_histogram(aes(y = ..density..), alpha = 0.2, binwidth = 3) + stat_ecdf(aes(x = drivenkm)); print(p)
Otrzymuję następujące informacje:
Oczywiście łuski są daleko. Jak można to naprawić, tak że zarówno histogram, jak i cdf można interpretować w rozsądny sposób?
Dzięki!