Suchergebnisse für Anfrage "scikit-learn"
Wie werden Parameter in Random Forest mithilfe von Scikit Learn optimiert?
class sklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None, bootstrap=True, oob_score=False, ...
Verschiedene Arten von Funktionen zum Trainieren von Naive Bayes in Python Pandas
Ich möchte eine Reihe von Funktionen verwenden, um mit dem Naive Bayes-Klassifikator die Klassifizierung von "A" oder "Nicht-A" zu trainieren. Ich habe drei Merkmale mit unterschiedlichen Werttypen: 1) Gesamtlänge - in positiver Ganzzahl 2) ...
Welche Schätzer in scikit-learn unterstützen keine spärlichen Matrizen?
Ich möchte einen Datensatz mit vielen nominalen Attributen trainieren. Ich habe in einigen Beiträgen festgestellt, dass zum Konvertieren von nominalen Attributen diese in sich wiederholende Binärmerkmale umgewandelt werden müssen. Auch wenn ich ...
uswertung der logistischen Regression mit Kreuzvalidieru
Ich möchte meinen Datensatz anhand einer Kreuzvalidierung testen / trainieren und die Leistung des logistischen Regressionsmodells für den gesamten Datensatz und nicht nur für den Testsatz (z. B. 25%) bewerten. Diese Konzepte sind für mich ...
Understanding min_df und max_df in scikit CountVectorizer
Ich habe fünf Textdateien, die ich in einen CountVectorizer eingebe. Was bedeutet die minimale / maximale Dokumenthäufigkeit genau, wenn Sie für die CountVectorizer-Instanz min_df und max_df angeben? Ist es die Häufigkeit eines Wortes in seiner ...
Memmap-Dateien für die Stapelverarbeitung verwenden
Ich habe einen riesigen Datensatz, auf den ich PCA möchte. Ich bin begrenzt durch RAM und Rechenleistung von PCA. Aus diesem Grund habe ich auf die Verwendung von iterativem PCA umgestellt. Dataset Size- ...
Scikit-Learn: Label not x ist in allen Trainingsbeispielen vorhanden
Ich versuche, eine Multilabel-Klassifizierung mit SVM durchzuführen. Ich habe fast 8k Features und habe auch einen y-Vektor mit einer Länge von fast 400. Ich habe bereits binarisierte Y-Vektoren, also habe ich @ ...
.arff Dateien mit scikit-learn?
Ich möchte ein @ verwend Attribut-Relation File Format [http://www.cs.waikato.ac.nz/ml/weka/arff.html] Ist das mit scikit-learn möglich, um eine NLP-Aufgabe zu erledigen? Wie kann ein @ verwendet werd.arff Datei mitscikit-learn?
Effizientes Erstellen spärlicher Pivot-Tabellen in Pandas?
Ich arbeite daran, eine Liste von Datensätzen mit zwei Spalten (A und B) in eine Matrixdarstellung umzuwandeln. Ich habe die Pivot-Funktion in Pandas verwendet, aber das Ergebnis ist ziemlich groß. Unterstützt Pandas das Schwenken in ein ...
Scikit-Learn-Verwirrungsmatrix
Ich kann nicht herausfinden, ob ich mein Binärklassifizierungsproblem richtig eingerichtet habe. Ich habe die positive Klasse 1 und die negative 0 benannt. Allerdings verwendet scikit-learn nach meinem Verständnis standardmäßig die Klasse 0 als ...