перед применением вашей модели.
я есть фактор с 2600 уровнями, и я хочу уменьшить его до ~ 10 перед моделированием
Я думал, что смогу сделать это с помощью операции, которая говорит: «если фактор указан в списке меньше, чем x раз, его следует поместить в корзину, называемую« другой »
Вот некоторые примеры данных:
df <- data.frame(colour=c("blue","blue","blue","green","green","orange","grey"))
И это результат, на который я надеюсь:
colour
1 blue
2 blue
3 blue
4 green
5 green
6 other
7 other
Я попробовал ниже:
df %>% mutate(colour = ifelse(count(colour) < 2, 'other', colour))
Ошибка в mutate_impl (.data, dots): Ошибка оценки: не применим метод для «групп», примененный к объекту класса «factor».