Das zeilenweise Setzen von Wertezählungen in neue Variablen, wie macht man das in R mit dplyr?
Ich habe einen großen Datenrahmen (df), der so aussieht:
structure(list(var1 = c(1, 2, 3, 4, 2, 3, 4, 3, 2), var2 = c(2,
3, 4, 1, 2, 1, 1, 1, 3), var3 = c(4, 4, 2, 3, 3, 1, 1, 1, 4),
var4 = c(2, 2, 2, 2, 3, 2, 3, 4, 1), var5 = c(4, 4, 2, 3,
3, 1, 1, 1, 4)), .Names = c("var1", "var2", "var3", "var4",
"var5"), row.names = c(NA, -9L), class = "data.frame")
var1 var2 var3 var4 var5
1 1 2 4 2 4
2 2 3 4 2 4
3 3 4 2 2 2
4 4 1 3 2 3
5 2 2 3 3 3
6 3 1 1 2 1
7 4 1 1 3 1
8 3 1 1 4 1
9 2 3 4 1 4
Jetzt muss ich das Vorkommen von Werten zeilenweise zählen und neue Variablen der Zählungen erstellen. Dies sollte das Ergebnis sein:
var1 var2 var3 var4 var5 n_1 n_2 n_3 n_4
1 1 2 4 2 4 1 2 0 2
2 2 3 4 2 4 0 2 1 2
3 3 4 2 2 2 0 3 1 1
4 4 1 3 2 3 1 1 2 1
5 2 2 3 3 3 0 2 3 0
6 3 1 1 2 1 3 1 1 0
7 4 1 1 3 1 3 0 1 1
8 3 1 1 4 1 3 0 1 1
9 2 3 4 1 4 1 1 1 2
Wie Sie sehen können, zeigt die Variable n_1 die Zeilenzahlen der Einsen, n_2 die Zeilenzahlen der Zweisen usw.
Ich habe einige Dplyr-Funktionen ausprobiert (weil ich ihre Geschwindigkeit mag), aber es ist mir noch nicht gelungen. Ich weiß, das ist definitiv hässlicher Code :-), aber mein Ansatz wäre so etwas:
newdf <- mutate(rowwise(df, n_1 = sum(df==1))
Hat jemand eine Idee, wie man mit diesem Problem umgeht? Vielen Dank im Voraus!