Как найти наиболее частые значения в нескольких столбцах, содержащих факторы

Question

Nov 14, 2013, 05:26 PM

Как найти наиболее частые значения в нескольких столбцах, содержащих факторы

Я все еще относительно новичок в R, поэтому заранее извиняюсь, если мой вопрос кажется слишком базовым.

Моя проблема заключается в следующем:

У меня есть набор данных, содержащий несколько факторных переменных, которые имеют одинаковые категории. Мне нужно найти категорию, которая встречается чаще всего для каждого наблюдения по факторам переменных. В случае связей может быть выбрано произвольное значение, хотя было бы здорово, если бы я мог иметь больше контроля над ним.

Мой набор данных содержит более ста факторов. Однако структура выглядит примерно так:

id <- 1:3
var1 <- c("red","yellow","green")
var2 <- c("red","yellow","green")
var3 <- c("yellow","orange","green")
var4 <- c("orange","green","yellow")
df <- data.frame(cbind(id, var1, var2, var3, var4))


> df
  id   var1   var2   var3   var4
1  1    red    red yellow orange
2  2 yellow yellow orange  green
3  3  green  green  green yellow

Решением должна быть переменная внутри фрейма данных, например, var5, которая содержит наиболее частую категорию для каждой строки. Это может быть фактор или числовой вектор (в случае, если данные должны быть сначала преобразованы в числовые векторы)

В этом случае я хотел бы иметь это решение:

> df$var5
[1] "red"    "yellow" "green"

Любой совет будет высоко ценится! Заранее спасибо!

Как найти наиболее частые значения в нескольких столбцах, содержащих факторы

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Как найти наиболее частые значения в нескольких столбцах, содержащих факторы

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы