Das SuperImpose-Histogramm passt in ein Diagramm ggplot

Ich habe ~ 5 sehr große Vektoren (~ 108 MM Einträge), so dass jede Handlung, die ich mit ihnen in R mache, ziemlich lange dauert.

Ich versuche, ihre Verteilung (Histogramm) zu visualisieren, und überlege, wie ich ihre Histogrammverteilungen in R am besten überlagern kann, ohne zu lange zu brauchen. Ich denke, zuerst eine Verteilung an das Histogramm anzupassen und dann alle Verteilungslinien in einem Diagramm zusammenzufassen.

Haben Sie Vorschläge, wie das geht?

Nehmen wir an, meine Vektoren sind:

x1, x2, x3, x4, x5.

Ich versuche diesen Code zu benutzen:Überlagerung von Histogrammen mit ggplot2 in R

Beispiel des Codes, den ich für 3 Vektoren verwende (R macht den Plot nicht):

n = length(x1)
dat <- data.frame(xx = c(x1, x2, x3),yy = rep(letters[1:3],each = n))
ggplot(dat,aes(x=xx)) + 
    geom_histogram(data=subset(dat,yy == 'a'),fill = "red", alpha = 0.2) +
    geom_histogram(data=subset(dat,yy == 'b'),fill = "blue", alpha = 0.2) +
    geom_histogram(data=subset(dat,yy == 'c'),fill = "green", alpha = 0.2)

Aber es dauert ewig, bis die Handlung erstellt ist, und schließlich hat es mich von R verdrängt. Irgendwelche Ideen, wie man ggplot2 effizient für große Vektoren einsetzt? Mir scheint, ich musste einen Datenrahmen mit 5 * 108MM Einträgen erstellen und dann plotten, was in meinem Fall sehr ineffizient ist.

Vielen Dank!

Antworten auf die Frage(1)

Ihre Antwort auf die Frage