Reduza o número de níveis para grandes variáveis categóricas
Existem alguns prontos para usar bibliotecas ou pacotes para python ou R para reduzir o número de níveis de grandes fatores categóricos?
Eu quero alcançar algo semelhante aoR: Variáveis categóricas "Binning" mas codifique nos fatores top-k mais frequentemente e "outros".