Jak znaleźć najczęstsze wartości w kilku kolumnach zawierających czynniki

Question

Nov 14, 2013, 05:26 PM

Jak znaleźć najczęstsze wartości w kilku kolumnach zawierających czynniki

Nadal jestem stosunkowo nowy w R, więc przepraszam z góry, jeśli moje pytanie wydaje się zbyt proste.

Mój problem jest następujący:

Mam zestaw danych zawierający kilka zmiennych czynników, które mają te same kategorie. Muszę znaleźć kategorię, która występuje najczęściej dla każdej obserwacji w zmiennych zmiennych. W przypadku powiązań można wybrać dowolną wartość, choć byłoby wspaniale, gdybym miał nad nią większą kontrolę.

Mój zestaw danych zawiera ponad sto czynników. Jednak struktura jest następująca:

id <- 1:3
var1 <- c("red","yellow","green")
var2 <- c("red","yellow","green")
var3 <- c("yellow","orange","green")
var4 <- c("orange","green","yellow")
df <- data.frame(cbind(id, var1, var2, var3, var4))


> df
  id   var1   var2   var3   var4
1  1    red    red yellow orange
2  2 yellow yellow orange  green
3  3  green  green  green yellow

Rozwiązaniem powinna być zmienna w ramce danych, na przykład var5, która zawiera najczęstszą kategorię dla każdego wiersza. Może to być czynnik lub wektor liczbowy (w przypadku, gdy dane muszą zostać przekształcone najpierw na wektory numeryczne)

W tym przypadku chciałbym mieć to rozwiązanie: