Suchergebnisse für Anfrage "categorical-data"
Reduzieren Sie die Anzahl der Ebenen für große kategoriale Variablen
Gibt es einige bereit, Bibliotheken oder Pakete für Python oder R zu verwenden, um die Anzahl der Ebenen für große kategoriale Faktoren zu reduzieren? Ich möchte etwas ähnliches wie @ erreichR: Kategoriale Variablen ...
Pandas: Kategorien in Zahlen konvertieren
Angenommen, ich habe einen Datenrahmen mit folgenden Ländern: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0Ich weiß, dass es eine pd.get_dummies-Funktion gibt, mit der die Länder in One-Hot-Codierungen konvertiert werden können. Ich möchte ...
predict.glm () mit drei neuen Kategorien in den Testdaten (r) (Fehler)
Ich habe einen Datensatz mit dem Namendata mit 481 092 Zeilen. Ich teiledata in zwei gleiche Hälften: Die erste Hälfte (Reihe 1: 240 546) heißttrain und wurde für das @ verwendglm();die zweite Hälfte (Zeile 240 547: 481 092) heißttest und ...
R: Erstellen einer kategorialen Variablen aus einer numerischen Variablen und benutzerdefinierten / endlosen / einwertigen Intervallen
Ich versuche oft, eine kategoriale Variable aus einer numerischen Variable und einer benutzerdefinierten Menge von Bereichen zu erstellen. Sagen Sie zum Beispiel, ich habe ein data.frame mit einer numerischen Variablendf$V und möchte eine neue ...
Kombinieren von Niederfrequenzzählungen
Versuchen, einen nominalen kategorialen Vektor durch Kombinieren von Niederfrequenzzählungen in eine Kategorie "Sonstige" zu reduzieren: Die Daten (Spalte eines Datenrahmens) sehen folgendermaßen aus und enthalten Informationen für alle 50 ...
Matplotlib: Wie werden kategoriale Daten auf der y-Achse dargestellt?
Sagen wir, ich habe den folgenden Code, der von @ komHie [https://stackoverflow.com/questions/29508208/best-way-to-plot-categorical-data?answertab=active#tab-top] : gender = ['male','male','female','male','female'] import matplotlib.pyplot ...
Wie gehe ich mit Spark-ml mit kategorialen Features um?
Wie gehe ich mit kategorialen Daten mit @ u spark-ml und nich spark-mllib ? Obwohl die Dokumentation nicht sehr klar ist, scheinen Klassifikatoren, z.RandomForestClassifier, LogisticRegression, haben einefeaturesCol Argument, das den Namen der ...
Probleme mit einer binären One-Hot (One-of-K) -Codierung in Python
ei der binären One-Hot-Codierung (auch als One-of-K-Codierung bezeichnet) wird für jeden eindeutigen Wert einer kategorialen Variablen eine binäre Spalte erstellt. Wenn beispielsweise eine Farbspalte (kategoriale Variable) die Werte "Rot", ...
Ist es möglich, kategoriale Spalten mit read_csv von Pandas zu lesen?
Ich habe versucht, das @ zu übergebdtype Parameter mitread_csv wiedtype={n: pandas.Categorical} aber das funktioniert nicht richtig (das Ergebnis ist ein Objekt).Das Handbuch ist ...
Wie wandle ich eine kategoriale Variable in Spark in eine Reihe von Spalten um, die mit {0,1} codiert sind?
Ich versuche, eine logistische Regression (LogisticRegressionWithLBFGS) mit Spark MLlib (mit Scala) für einen Datensatz durchzuführen, der kategoriale Variablen enthält. Ich stelle fest, dass Spark nicht in der Lage war, mit solchen Variablen zu ...