Reduzieren Sie die Anzahl der Ebenen für große kategoriale Variablen
Gibt es einige bereit, Bibliotheken oder Pakete für Python oder R zu verwenden, um die Anzahl der Ebenen für große kategoriale Faktoren zu reduzieren?
Ich möchte etwas ähnliches wie @ erreichR: Kategoriale Variablen "Binning" aber in die häufigsten Top-k-Faktoren und "andere" kodieren.