Suchergebnisse für Anfrage "scikit-learn"

1 die antwort

Sklearn SGDClassifier teilweise fit

Ich versuche, SGD zu verwenden, um einen großen Datensatz zu klassifizieren. Da die Daten zu groß sind, um in den Speicher zu passen, möchte ich die verwendenTeil_Fit Methode zum Trainieren des Klassifikators. Ich habe eine Stichprobe des ...

5 die antwort

Wie kann ich den Rückgabewert mit dem Python-Timeit-Modul erfassen?

Ich führe mehrere Algorithmen für maschinelles Lernen mit sklearn in einer for-Schleife aus und möchte sehen, wie lange sie jeweils dauern. Das Problem ist, dass ich auch einen Wert zurückgeben muss und ihn NICHT mehrmals ausführen möchte, da ...

2 die antwort

sklearn: Haben Sie einen Schätzer, der Stichproben filtert

Ich versuche, meinen eigenen Imputer zu implementieren. Unter bestimmten Umständen möchte ich einige der Zugmuster filtern (die ich für minderwertig halte). Seit demtransform Methode gibt nur zurückX und nichty, undy selbst ist ein Numpy-Array ...

TOP-Veröffentlichungen

1 die antwort

Ist scikit-learn für Big-Data-Aufgaben geeignet?

Ich arbeite an einer TREC-Aufgabe, bei der maschinelles Lernen zum Einsatz kommt. Dabei besteht der Datensatz aus mehr als 5 Terabyte Webdokumenten, aus denen Wörterbündelvektoren extrahiert werden sollen.scikit-learn verfügt über eine Reihe ...

1 die antwort

Scipy Fehler: numpy.dtype Größe geändert, kann auf binäre Inkompatibilität hinweisen (und damit verbundenes seltsames Verhalten)

Ich installiere numpy / scipy / scikit-learn unter OS X 10.9.4 und erhalte die Fehlermeldung "numpy.dtype size changed, may indicate binary incompatibility". Hier ist, was ich getan habe, um das Repo zu konstruieren: mkvirtualenv thm workon ...

1 die antwort

KL-Divergenz zweier GMMs

Ich habe zwei GMMs, mit denen ich zwei verschiedene Datensätze in den gleichen Raum gepasst habe, und ich möchte die KL-Divergenz zwischen ihnen berechnen. Zur Zeit verwende ich die in sklearn (@ definierten ...

1 die antwort

Scikit-learn Ridge Regression mit unregelmäßigem Intercept Term

Bezieht die Scikit-Learn-Ridge-Regression den Intercept-Koeffizienten in den Regularisierungsterm ein, und wenn ja, gibt es eine Möglichkeit, die Ridge-Regression ohne Regularisierung des Intercept durchzuführen? Angenommen, ich habe eine ...

1 die antwort

sklearn: So beschleunigen Sie einen Vektorisierer (z. B. Tfidfvectorizer)

achdem ich mein Programm gründlich analysiert habe, konnte ich feststellen, dass es vom Vectorizer verlangsamt wir Ich arbeite an Textdaten, und zwei Zeilen der einfachen tfidf-Unigramm-Vektorisierung beanspruchen 99,2% der Gesamtzeit, die der ...

3 die antwort

Scikit-learn GridSearch mit dem Fehler "ValueError: Multiclass-Format wird nicht unterstützt"

Ich versuche, GridSearch für die Parameterschätzung von LinearSVC () wie folgt zu verwenden - clf_SVM = LinearSVC() params = { 'C': [0.5, 1.0, 1.5], 'tol': [1e-3, 1e-4, 1e-5], 'multi_class': ['ovr', 'crammer_singer'], } gs = ...

2 die antwort

Was ist ein guter Wertebereich für die über GridSearchCV () zu untersuchenden svm.SVC () -Hyperparameter?

Ich stoße auf das Problem, dass die Hyperparameter meinessvm.SVC() sind zu breit, so dass dasGridSearchCV() wird nie abgeschlossen! Eine Idee ist, @ zu verwendRandomizedSearchCV() stattdessen. Aber auch hier ist mein Datensatz relativ groß, ...