Suchergebnisse für Anfrage "scikit-learn"

8 die antwort

Wie werden Parameter in Random Forest mithilfe von Scikit Learn optimiert?

class sklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None, bootstrap=True, oob_score=False, ...

4 die antwort

Verschiedene Arten von Funktionen zum Trainieren von Naive Bayes in Python Pandas

Ich möchte eine Reihe von Funktionen verwenden, um mit dem Naive Bayes-Klassifikator die Klassifizierung von "A" oder "Nicht-A" zu trainieren. Ich habe drei Merkmale mit unterschiedlichen Werttypen: 1) Gesamtlänge - in positiver Ganzzahl 2) ...

1 die antwort

Welche Schätzer in scikit-learn unterstützen keine spärlichen Matrizen?

Ich möchte einen Datensatz mit vielen nominalen Attributen trainieren. Ich habe in einigen Beiträgen festgestellt, dass zum Konvertieren von nominalen Attributen diese in sich wiederholende Binärmerkmale umgewandelt werden müssen. Auch wenn ich ...

TOP-Veröffentlichungen

2 die antwort

uswertung der logistischen Regression mit Kreuzvalidieru

Ich möchte meinen Datensatz anhand einer Kreuzvalidierung testen / trainieren und die Leistung des logistischen Regressionsmodells für den gesamten Datensatz und nicht nur für den Testsatz (z. B. 25%) bewerten. Diese Konzepte sind für mich ...

8 die antwort

Understanding min_df und max_df in scikit CountVectorizer

Ich habe fünf Textdateien, die ich in einen CountVectorizer eingebe. Was bedeutet die minimale / maximale Dokumenthäufigkeit genau, wenn Sie für die CountVectorizer-Instanz min_df und max_df angeben? Ist es die Häufigkeit eines Wortes in seiner ...

4 die antwort

Memmap-Dateien für die Stapelverarbeitung verwenden

Ich habe einen riesigen Datensatz, auf den ich PCA möchte. Ich bin begrenzt durch RAM und Rechenleistung von PCA. Aus diesem Grund habe ich auf die Verwendung von iterativem PCA umgestellt. Dataset Size- ...

2 die antwort

Scikit-Learn: Label not x ist in allen Trainingsbeispielen vorhanden

Ich versuche, eine Multilabel-Klassifizierung mit SVM durchzuführen. Ich habe fast 8k Features und habe auch einen y-Vektor mit einer Länge von fast 400. Ich habe bereits binarisierte Y-Vektoren, also habe ich @ ...

6 die antwort

.arff Dateien mit scikit-learn?

Ich möchte ein @ verwend Attribut-Relation File Format [http://www.cs.waikato.ac.nz/ml/weka/arff.html] Ist das mit scikit-learn möglich, um eine NLP-Aufgabe zu erledigen? Wie kann ein @ verwendet werd.arff Datei mitscikit-learn?

6 die antwort

Effizientes Erstellen spärlicher Pivot-Tabellen in Pandas?

Ich arbeite daran, eine Liste von Datensätzen mit zwei Spalten (A und B) in eine Matrixdarstellung umzuwandeln. Ich habe die Pivot-Funktion in Pandas verwendet, aber das Ergebnis ist ziemlich groß. Unterstützt Pandas das Schwenken in ein ...

4 die antwort

Scikit-Learn-Verwirrungsmatrix

Ich kann nicht herausfinden, ob ich mein Binärklassifizierungsproblem richtig eingerichtet habe. Ich habe die positive Klasse 1 und die negative 0 benannt. Allerdings verwendet scikit-learn nach meinem Verständnis standardmäßig die Klasse 0 als ...