Suchergebnisse für Anfrage "scikit-learn"

6 die antwort

Effizientes Erstellen spärlicher Pivot-Tabellen in Pandas?

Ich arbeite daran, eine Liste von Datensätzen mit zwei Spalten (A und B) in eine Matrixdarstellung umzuwandeln. Ich habe die Pivot-Funktion in Pandas verwendet, aber das Ergebnis ist ziemlich groß. Unterstützt Pandas das Schwenken in ein ...

8 die antwort

Machen, dass SVM in Python schneller läuft

Verwendung derCod unten für SVM in Python: from sklearn import datasets from sklearn.multiclass import OneVsRestClassifier from sklearn.svm import SVC iris = datasets.load_iris() X, y = iris.data, iris.target clf = ...

2 die antwort

Lade eingelegte Klassifiziererdaten: Vokabular nicht angepasst Fehler

Ich habe alle zugehörigen Fragen hier gelesen, konnte aber keine funktionierende Lösung finden: Meine Klassifikatorerstellung: class StemmedTfidfVectorizer(TfidfVectorizer): def build_analyzer(self): analyzer = super(TfidfVectorizer, ...

TOP-Veröffentlichungen

8 die antwort

Warum erhalte ich einen ImportError, wenn ich eine .exe mit pyinstaller erstelle?

Ich habe gerade ein kleines GUI-Programm erstellt, das in IPython kompiliert und funktioniert, aber wenn ich versuche, es in ein @ zu exportier.exe mit Pyinstaller gibt es mir einen Importfehler. Ich bin sicher, es istsklearn denn wenn ich das @ ...

2 die antwort

Wie verwende ich CountVectorizerand () von sklearn, um n-Gramme zu erhalten, die Interpunktionen als separate Token enthalten?

Ich benutze sklearn.feature_extraction.text.CountVectorizer [http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html] , um n-Gramm zu berechnen. Beispiel import sklearn.feature_extraction.text # ...

4 die antwort

Memmap-Dateien für die Stapelverarbeitung verwenden

Ich habe einen riesigen Datensatz, auf den ich PCA möchte. Ich bin begrenzt durch RAM und Rechenleistung von PCA. Aus diesem Grund habe ich auf die Verwendung von iterativem PCA umgestellt. Dataset Size- ...

4 die antwort

Probleme mit einer binären One-Hot (One-of-K) -Codierung in Python

ei der binären One-Hot-Codierung (auch als One-of-K-Codierung bezeichnet) wird für jeden eindeutigen Wert einer kategorialen Variablen eine binäre Spalte erstellt. Wenn beispielsweise eine Farbspalte (kategoriale Variable) die Werte "Rot", ...

14 die antwort

Wie erkunde ich einen mit scikit learn @ erstellten Entscheidungsbau

Ich erstelle einen Entscheidungsbaum mit clf = tree.DecisionTreeClassifier() clf = clf.fit(X_train, Y_train)Das alles funktioniert gut. Wie erkunde ich dann den Entscheidungsbaum? Wie finde ich zum Beispiel, welche Einträge von X_train in ...

4 die antwort

Errors in partial_fit in scikit learn

Beim Training mit einer Funktion partial_fit in scikit learn erhalte ich die folgende Fehlermeldung, ohne dass das Programm beendet wird. Wie ist das möglich und wie wirkt sich das aus, obwohl sich das trainierte Modell korrekt verhält und die ...

4 die antwort

DBSCAN-Fehler mit Cosinus-Metrik in Python

Ich habe versucht, den DBSCAN-Algorithmus aus der Scikit-Learn-Bibliothek mit der Cosinus-Metrik zu verwenden, aber der Fehler blieb bestehen. Die Codezeile ist db = DBSCAN(eps=1, min_samples=2, metric='cosine').fit(X)woX ist eincsr_matrix. Der ...