Suchergebnisse für Anfrage "machine-learning"

1 die antwort

Sklearn SGDClassifier teilweise fit

Ich versuche, SGD zu verwenden, um einen großen Datensatz zu klassifizieren. Da die Daten zu groß sind, um in den Speicher zu passen, möchte ich die verwendenTeil_Fit Methode zum Trainieren des Klassifikators. Ich habe eine Stichprobe des ...

2 die antwort

Berechnen Sie die kumulative Verteilungsfunktion (Cumulative Distribution Function, CDF) in Python

Wie kann ich in Python das berechnen?Kumulative Verteilungsfunktion (CDF) [https://en.wikipedia.org/wiki/Cumulative_distribution_function]? Ich möchte es aus einer Reihe von Punkten berechnen, die ich habe (diskrete Verteilung), nicht mit den ...

7 die antwort

Fehler in ConfusionMatrix Die Daten und Referenzfaktoren müssen dieselbe Anzahl von Ebenen haben

Ich habe ein Baummodell mit R Caret trainiert. Ich versuche jetzt, eine Verwirrungsmatrix zu generieren und erhalte weiterhin den folgenden Fehler: Fehler in confusionMatrix.default (predictionsTree, testdata $ catgeory): Die Daten und ...

TOP-Veröffentlichungen

1 die antwort

Ist scikit-learn für Big-Data-Aufgaben geeignet?

Ich arbeite an einer TREC-Aufgabe, bei der maschinelles Lernen zum Einsatz kommt. Dabei besteht der Datensatz aus mehr als 5 Terabyte Webdokumenten, aus denen Wörterbündelvektoren extrahiert werden sollen.scikit-learn verfügt über eine Reihe ...

2 die antwort

Wie verwende ich die k-fache Kreuzvalidierung in einem neuronalen Netzwerk?

Wir schreiben eine kleine ANN, die 7000 Produkte anhand von 10 Eingabevariablen in 7 Klassen einteilen soll. Um dies zu tun, müssen wir die k-fache Kreuzvalidierung verwenden, aber wir sind irgendwie verwirrt. Wir haben diesen Auszug aus der ...

9 die antwort

Was ist maschinelles Lernen? [geschlossen

Was istmaschinelles Lerne ?Was macht maschinelles LernenCod tun Wenn wir sagen, dass die Maschine lernt, ändert sie den Code vonselbs oder es ändert die Historie (Datenbank), die die Codeerfahrung für einen gegebenen Satz von Eingaben enthält?

3 die antwort

Scikit-learn GridSearch mit dem Fehler "ValueError: Multiclass-Format wird nicht unterstützt"

Ich versuche, GridSearch für die Parameterschätzung von LinearSVC () wie folgt zu verwenden - clf_SVM = LinearSVC() params = { 'C': [0.5, 1.0, 1.5], 'tol': [1e-3, 1e-4, 1e-5], 'multi_class': ['ovr', 'crammer_singer'], } gs = ...

4 die antwort

Apache Spark ALS Ergebnisse der kollaborativen Filterung. Sie machen keinen Sinn

Ich wollte Spark für die kollaborative Filterung mit MLlib ausprobieren, wie in diesem Tutorial ...

7 die antwort

Warum Feature-Skalierung?

Ich habe festgestellt, dass die Skalierung in SVM (Support Vector Machine) -Problemen die Leistung wirklich verbessert ... Ich habe diese Erklärung gelesen: "Der Hauptvorteil der Skalierung besteht darin, Attribute in größeren numerischen ...

1 die antwort

Behandlung des Klassenungleichgewichts in der binären Klassifikation

Hier ist eine kurze Beschreibung meines Problems: Ich arbeite an einemüberwachtes Lerne Aufgabe, ein @ zu trainierbinä classifier.Ich habe einen Datensatz mit einer großen Klasse Ungleichgewicht Verteilung: 8 negative Instanzen, jede ...