Suchergebnisse für Anfrage "categorical-data"

14 die antwort

Kombinieren von Niederfrequenzzählungen

Versuchen, einen nominalen kategorialen Vektor durch Kombinieren von Niederfrequenzzählungen in eine Kategorie "Sonstige" zu reduzieren: Die Daten (Spalte eines Datenrahmens) sehen folgendermaßen aus und enthalten Informationen für alle 50 ...

4 die antwort

R: Erstellen einer kategorialen Variablen aus einer numerischen Variablen und benutzerdefinierten / endlosen / einwertigen Intervallen

Ich versuche oft, eine kategoriale Variable aus einer numerischen Variable und einer benutzerdefinierten Menge von Bereichen zu erstellen. Sagen Sie zum Beispiel, ich habe ein data.frame mit einer numerischen Variablendf$V und möchte eine neue ...

4 die antwort

predict.glm () mit drei neuen Kategorien in den Testdaten (r) (Fehler)

Ich habe einen Datensatz mit dem Namendata mit 481 092 Zeilen. Ich teiledata in zwei gleiche Hälften: Die erste Hälfte (Reihe 1: 240 546) heißttrain und wurde für das @ verwendglm();die zweite Hälfte (Zeile 240 547: 481 092) heißttest und ...

TOP-Veröffentlichungen

6 die antwort

Pandas: Kategorien in Zahlen konvertieren

Angenommen, ich habe einen Datenrahmen mit folgenden Ländern: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0Ich weiß, dass es eine pd.get_dummies-Funktion gibt, mit der die Länder in One-Hot-Codierungen konvertiert werden können. Ich möchte ...

10 die antwort

Wie kann ich R zwingen, einen bestimmten Faktor als Referenz für eine Regression zu verwenden?

Wie kann ich R anweisen, eine bestimmte Ebene als Referenz zu verwenden, wenn ich in einer Regression binäre erklärende Variablen verwende? Standardmäßig wird nur eine bestimmte Stufe verwendet. lm(x ~ y + as.factor(b))mitb {0, 1, 2, 3, 4}. ...

8 die antwort

Reduzieren Sie die Anzahl der Ebenen für große kategoriale Variablen

Gibt es einige bereit, Bibliotheken oder Pakete für Python oder R zu verwenden, um die Anzahl der Ebenen für große kategoriale Faktoren zu reduzieren? Ich möchte etwas ähnliches wie @ erreichR: Kategoriale Variablen ...