Teilmenge des Datenrahmens basierend auf der Anzahl der Zeilen pro Gruppe
Ich habe Daten wie diese, bei denen ein "Name" mehr als dreimal vorkommt:
df <- data.frame(name = c("a", "a", "a", "b", "b", "c", "c", "c", "c"), x = 1:9)
Ich möchte die Daten basierend auf der Anzahl der Zeilen (Beobachtungen) in jeder Ebene der Variablen "name" unterteilen (filtern). Wenn eine bestimmte Ebene von "Name" mehr als dreimal vorkommt, möchte ich alle Zeilen entfernen, die zu dieser Ebene gehören.
Ich habe diesen Code geschrieben, kann ihn aber nicht zum Laufen bringen.
as.data.frame(table(unique(df)$name))
subset(df, name > 3)