Jak znaleźć najczęstsze wartości w kilku kolumnach zawierających czynniki
Nadal jestem stosunkowo nowy w R, więc przepraszam z góry, jeśli moje pytanie wydaje się zbyt proste.
Mój problem jest następujący:
Mam zestaw danych zawierający kilka zmiennych czynników, które mają te same kategorie. Muszę znaleźć kategorię, która występuje najczęściej dla każdej obserwacji w zmiennych zmiennych. W przypadku powiązań można wybrać dowolną wartość, choć byłoby wspaniale, gdybym miał nad nią większą kontrolę.
Mój zestaw danych zawiera ponad sto czynników. Jednak struktura jest następująca:
id <- 1:3
var1 <- c("red","yellow","green")
var2 <- c("red","yellow","green")
var3 <- c("yellow","orange","green")
var4 <- c("orange","green","yellow")
df <- data.frame(cbind(id, var1, var2, var3, var4))
> df
id var1 var2 var3 var4
1 1 red red yellow orange
2 2 yellow yellow orange green
3 3 green green green yellow
Rozwiązaniem powinna być zmienna w ramce danych, na przykład var5, która zawiera najczęstszą kategorię dla każdego wiersza. Może to być czynnik lub wektor liczbowy (w przypadku, gdy dane muszą zostać przekształcone najpierw na wektory numeryczne)
W tym przypadku chciałbym mieć to rozwiązanie:
> df$var5
[1] "red" "yellow" "green"
Wszelkie porady będą bardzo mile widziane! Z góry dziękuję!