Как найти наиболее частые значения в нескольких столбцах, содержащих факторы
Я все еще относительно новичок в R, поэтому заранее извиняюсь, если мой вопрос кажется слишком базовым.
Моя проблема заключается в следующем:
У меня есть набор данных, содержащий несколько факторных переменных, которые имеют одинаковые категории. Мне нужно найти категорию, которая встречается чаще всего для каждого наблюдения по факторам переменных. В случае связей может быть выбрано произвольное значение, хотя было бы здорово, если бы я мог иметь больше контроля над ним.
Мой набор данных содержит более ста факторов. Однако структура выглядит примерно так:
id <- 1:3
var1 <- c("red","yellow","green")
var2 <- c("red","yellow","green")
var3 <- c("yellow","orange","green")
var4 <- c("orange","green","yellow")
df <- data.frame(cbind(id, var1, var2, var3, var4))
> df
id var1 var2 var3 var4
1 1 red red yellow orange
2 2 yellow yellow orange green
3 3 green green green yellow
Решением должна быть переменная внутри фрейма данных, например, var5, которая содержит наиболее частую категорию для каждой строки. Это может быть фактор или числовой вектор (в случае, если данные должны быть сначала преобразованы в числовые векторы)
В этом случае я хотел бы иметь это решение:
> df$var5
[1] "red" "yellow" "green"
Любой совет будет высоко ценится! Заранее спасибо!