Suchergebnisse für Anfrage "categorical-data"

8 die antwort

Reduzieren Sie die Anzahl der Ebenen für große kategoriale Variablen

Gibt es einige bereit, Bibliotheken oder Pakete für Python oder R zu verwenden, um die Anzahl der Ebenen für große kategoriale Faktoren zu reduzieren? Ich möchte etwas ähnliches wie @ erreichR: Kategoriale Variablen ...

6 die antwort

Pandas: Kategorien in Zahlen konvertieren

Angenommen, ich habe einen Datenrahmen mit folgenden Ländern: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0Ich weiß, dass es eine pd.get_dummies-Funktion gibt, mit der die Länder in One-Hot-Codierungen konvertiert werden können. Ich möchte ...

4 die antwort

predict.glm () mit drei neuen Kategorien in den Testdaten (r) (Fehler)

Ich habe einen Datensatz mit dem Namendata mit 481 092 Zeilen. Ich teiledata in zwei gleiche Hälften: Die erste Hälfte (Reihe 1: 240 546) heißttrain und wurde für das @ verwendglm();die zweite Hälfte (Zeile 240 547: 481 092) heißttest und ...

TOP-Veröffentlichungen

4 die antwort

R: Erstellen einer kategorialen Variablen aus einer numerischen Variablen und benutzerdefinierten / endlosen / einwertigen Intervallen

Ich versuche oft, eine kategoriale Variable aus einer numerischen Variable und einer benutzerdefinierten Menge von Bereichen zu erstellen. Sagen Sie zum Beispiel, ich habe ein data.frame mit einer numerischen Variablendf$V und möchte eine neue ...

14 die antwort

Kombinieren von Niederfrequenzzählungen

Versuchen, einen nominalen kategorialen Vektor durch Kombinieren von Niederfrequenzzählungen in eine Kategorie "Sonstige" zu reduzieren: Die Daten (Spalte eines Datenrahmens) sehen folgendermaßen aus und enthalten Informationen für alle 50 ...

2 die antwort

Matplotlib: Wie werden kategoriale Daten auf der y-Achse dargestellt?

Sagen wir, ich habe den folgenden Code, der von @ komHie [https://stackoverflow.com/questions/29508208/best-way-to-plot-categorical-data?answertab=active#tab-top] : gender = ['male','male','female','male','female'] import matplotlib.pyplot ...

8 die antwort

Wie gehe ich mit Spark-ml mit kategorialen Features um?

Wie gehe ich mit kategorialen Daten mit @ u spark-ml und nich spark-mllib ? Obwohl die Dokumentation nicht sehr klar ist, scheinen Klassifikatoren, z.RandomForestClassifier, LogisticRegression, haben einefeaturesCol Argument, das den Namen der ...

4 die antwort

Probleme mit einer binären One-Hot (One-of-K) -Codierung in Python

ei der binären One-Hot-Codierung (auch als One-of-K-Codierung bezeichnet) wird für jeden eindeutigen Wert einer kategorialen Variablen eine binäre Spalte erstellt. Wenn beispielsweise eine Farbspalte (kategoriale Variable) die Werte "Rot", ...

4 die antwort

Ist es möglich, kategoriale Spalten mit read_csv von Pandas zu lesen?

Ich habe versucht, das @ zu übergebdtype Parameter mitread_csv wiedtype={n: pandas.Categorical} aber das funktioniert nicht richtig (das Ergebnis ist ein Objekt).Das Handbuch ist ...

8 die antwort

Wie wandle ich eine kategoriale Variable in Spark in eine Reihe von Spalten um, die mit {0,1} codiert sind?

Ich versuche, eine logistische Regression (LogisticRegressionWithLBFGS) mit Spark MLlib (mit Scala) für einen Datensatz durchzuführen, der kategoriale Variablen enthält. Ich stelle fest, dass Spark nicht in der Lage war, mit solchen Variablen zu ...