Suchergebnisse für Anfrage "machine-learning"

1 die antwort

Lesen Sie den Dokumentnamen in der scikit-learn tf-idf Matrix

Ich habe eine tf-idf-Matrix erstellt, möchte aber jetzt die ersten zwei Wörter für jedes Dokument abrufen. Ich möchte die ID des Dokuments übergeben und es sollte mir die ersten beiden Wörter geben. Right now, ich habe diese ...

2 die antwort

Was ist ein guter Wertebereich für die über GridSearchCV () zu untersuchenden svm.SVC () -Hyperparameter?

Ich stoße auf das Problem, dass die Hyperparameter meinessvm.SVC() sind zu breit, so dass dasGridSearchCV() wird nie abgeschlossen! Eine Idee ist, @ zu verwendRandomizedSearchCV() stattdessen. Aber auch hier ist mein Datensatz relativ groß, ...

1 die antwort

Wie klassifiziere ich URLs? Was sind URL-Funktionen? Auswählen und Extrahieren von Features aus URL

Ich arbeite gerade an einem Klassifizierungsproblem. Das My Trained-Modell (Maschinelles Lernen) ist ein Zwei-Klassen-Problem und muss entscheiden / vorhersagen, ob eine URL zugelassen oder blockiert werden soll. Meine Frage ist sehr ...

TOP-Veröffentlichungen

3 die antwort

Word2Vec: Anzahl der Dimensionen

Ich verwende Word2Vec mit einem Datensatz von ungefähr 11.000.000 Token, um Ähnlichkeiten zwischen beiden Wörtern zu erzielen (als Teil der Synonymextraktion für eine nachgelagerte Aufgabe), aber ich verstehe nicht, wie viele Dimensionen ich mit ...

4 die antwort

Tag-Generierung aus einem Textinhalt

Ich bin gespannt, ob es einen Algorithmus / eine Methode gibt, mit der aus einem bestimmten Text mithilfe von Gewichtsberechnungen, Auftrittsraten oder anderen Tools Schlüsselwörter / Tags generiert werden können. Zusätzlich bin ich dankbar, ...

6 die antwort

Problem mit Präzisions-Gleitkommaoperation in C

Für eines meiner Kursprojekte habe ich begonnen, "Naive Bayesian Classifier" in C zu implementieren. Mein Projekt besteht darin, eine Dokumentklassifizierungsanwendung (insbesondere Spam) unter Verwendung großer Trainingsdaten zu ...

6 die antwort

Wie bekomme ich die informativsten Funktionen für den Scikit-Learn-Klassifikator für verschiedene Klassen?

NLTK-Paket bietet eine Methodeshow_most_informative_features(), um die wichtigsten Funktionen für beide Klassen zu finden, mit Ausgabe wie: contains(outstanding) = True pos : neg = 11.1 : 1.0 contains(seagal) = True neg : pos = 7.7 : 1.0 ...

4 die antwort

Geschwindigkeitsoptimierte Klassifizierung in Matlab

Ich habe ein Bild mit der Größe RGBuint8(576,720,3) wo ich jedes Pixel einer Reihe von Farben zuordnen möchte. Ich habe mit @ transformiergb2lab aus dem RGB-Raum in den LAB-Raum und entfernte dann die L-Ebene, sodass sie jetzt ein ...

2 die antwort

R: unklares Verhalten der tuneRF-Funktion (randomForest-Paket)

Ich fühle mich unwohl mit der Bedeutung desstepFactor Parameter destuneRF [http://www.inside-r.org/packages/cran/randomForest/docs/tuneRF] -Funktion, mit der das @ eingestellt wimtry -Parameter, der im @ -Parameter weiter verwendet ...

2 die antwort

assen Sie die multivariate Gauß-Verteilung an einen bestimmten Datensatz a

Ich muss die multivariate Gauß-Verteilung anpassen, d. H. Den mittleren Vektor und die Kovarianzmatrix der nächsten multivariaten Gauß-Verteilung für einen bestimmten Datensatz von Audio-Features in Python ermitteln. Die Audioeigenschaften ...