educción del número de niveles de factores antes de modelar
Tengo un factor con 2600 niveles y quiero reducirlo a ~ 10 antes de modelar
Pensé que podría hacer esto con una operación que dice "si un factor aparece menos de x veces, debería colocarse en un cubo llamado" otro "
Aquí hay algunos datos de ejemplo:
df <- data.frame(colour=c("blue","blue","blue","green","green","orange","grey"))
Y esta es la salida que espero:
colour
1 blue
2 blue
3 blue
4 green
5 green
6 other
7 other
He intentado lo siguiente:
df %>% mutate(colour = ifelse(count(colour) < 2, 'other', colour))
Error en mutate_impl (.data, puntos): error de evaluación: no se aplica ningún método para 'grupos' a un objeto de la clase "factor".