Suchergebnisse für Anfrage "categorical-data"
Wie kann ich R zwingen, einen bestimmten Faktor als Referenz für eine Regression zu verwenden?
Wie kann ich R anweisen, eine bestimmte Ebene als Referenz zu verwenden, wenn ich in einer Regression binäre erklärende Variablen verwende? Standardmäßig wird nur eine bestimmte Stufe verwendet. lm(x ~ y + as.factor(b))mitb {0, 1, 2, 3, 4}. ...
Wie führe ich den Spark-Entscheidungsbaum mit einem kategorialen Feature-Set in Scala aus?
Ich habe ein Feature-Set mit einem entsprechenden categoricalFeaturesInfo: Map [Int, Int]. Für mein ganzes Leben kann ich jedoch nicht herausfinden, wie ich die DecisionTree-Klasse zum Laufen bringen soll. Es wird nur ein LabeledPoint als Daten ...
Wie wandle ich eine kategoriale Variable in Spark in eine Reihe von Spalten um, die mit {0,1} codiert sind?
Ich versuche, eine logistische Regression (LogisticRegressionWithLBFGS) mit Spark MLlib (mit Scala) für einen Datensatz durchzuführen, der kategoriale Variablen enthält. Ich stelle fest, dass Spark nicht in der Lage war, mit solchen Variablen zu ...
Reduzieren Sie die Anzahl der Ebenen für große kategoriale Variablen
Gibt es einige bereit, Bibliotheken oder Pakete für Python oder R zu verwenden, um die Anzahl der Ebenen für große kategoriale Faktoren zu reduzieren? Ich möchte etwas ähnliches wie @ erreichR: Kategoriale Variablen ...
Wie (und warum) benutzt du Kontraste?
Unter welchen Umständen erzeugen Sie Kontraste in Ihrer Analyse? Wie wird es gemacht und wofür wird es verwendet? Ich überprüfte?contrasts und?C - beide führen zu "Kapitel 2 der statistischen Modelle in S", das mir nicht ohne weiteres zur ...
Fügen Sie Faktoren im Datenrahmen eine zusätzliche Ebene hinzu
Ich habe einen Datenrahmen mit numerischen und geordneten Faktorspalten. Ich habe viele NA-Werte, daher ist ihnen kein Level zugewiesen. Ich habe NA in "Keine Antwort" geändert, aber die Ebenen der Faktorspalten enthalten diese Ebene nicht. ...
Plotten mit ggplot2: "Fehler: Diskreter Wert für kontinuierliche Skala" auf der kategorialen y-Achse
Der unten stehende Plotcode gibtError: Discrete value supplied to continuous scale Was ist los mit diesem Code? Es funktioniert einwandfrei, bis ich versuche, die Skala zu ändern, damit der Fehler vorliegt. Ich habe versucht, Lösungen für ...
Probleme mit einer binären One-Hot (One-of-K) -Codierung in Python
ei der binären One-Hot-Codierung (auch als One-of-K-Codierung bezeichnet) wird für jeden eindeutigen Wert einer kategorialen Variablen eine binäre Spalte erstellt. Wenn beispielsweise eine Farbspalte (kategoriale Variable) die Werte "Rot", ...
Wie pandas DataFrame-Spalte von Categorical aus String-Spalte zu generieren?
Ich kann eine Pandas-Zeichenfolgenspalte in "Categorical" konvertieren, aber wenn ich versuche, sie als neue DataFrame-Spalte einzufügen, wird sie ...