Suchergebnisse für Anfrage "data-mining"
Informationsgewinnberechnung für eine Textdatei?
Ich arbeite anTextkategorisierung unter Verwendung von Informationsgewinn, PCA und genetischem AlgorithmusAber nach dem AuftrittVorverarbeitung(Stemming, Stopword Removal, TFIDF) auf dem Dokument m verwirrt, wie man voranschreitet, ...
Implementierung des k-means Clustering Algorithmus
In meinem Programm nehme ich k = 2 für den k-Mittelwert-Algorithmus, d. H. Ich möchte nur 2 Cluster. Ich habe es sehr einfach und unkompliziert implementiert, aber ich kann immer noch nicht verstehen, warum mein Programm in eine Endlosschleife ...
Verwenden Sie die absolute Pearson-Korrelation als Abstand im K-Means-Algorithmus (MATLAB)
Ich muss einige Cluster mithilfe einer Korrelationsentfernung erstellen, aber anstelle der integrierten 'Entfernung' 'Korrelation', die als d = 1-ri definiert ist, muss die absolute Pearson-Entfernung verwendet werden. In meiner Anwendung sollten ...
Clustering eines sehr großen Datensatzes in R
Ich habe einen Datensatz bestehend aus 70.000 numerischen Werten, die Entfernungen von 0 bis 50 darstellen, und ich möchte diese Zahlen gruppieren. Wenn ich jedoch den klassischen Clustering-Ansatz versuche, müsste ich eine Distanzmatrix von ...
Feedback oder Verstärkung beim maschinellen Lernen nutzen?
Ich versuche, ein Klassifizierungsproblem zu lösen. Es scheint, dass viele klassische Ansätze einem ähnlichen Paradigma folgen. Das heißt, trainieren Sie ein Modell mit einem Trainingssatz und verwenden Sie es dann, um die Klassenbeschriftungen ...
Verwendung der Distanzfunktion von ELKI
Dies ist eine Fortsetzung von avorherige Frage [https://stackoverflow.com/questions/23634614/running-dbscan-in-elki/23639300?noredirect=1#23639300] , wo wir bemerkten, dass die Verwendung von euklidischen Abständen mit lat. langen Koordinaten ...
Machen Sie über die Twitter-API mithilfe von Python Tweepy ganz bestimmte Zeitanforderungen (sekundengenau)?
Ich möchte Tweets zu einem bestimmten Thema (zum Beispiel: "Krebs") mit Python Tweepy anfordern. In der Regel kann die Uhrzeit jedoch nur für einen bestimmten Tag angegeben werden, z. B. startSince = '2014-10-01' endUntil = '2014-10-02' for ...
Architektur für die Datenbankanalyse
Wir haben eine Architektur, in der wir jedem Kunden Business Intelligence-ähnliche Dienste für seine Website (Internet-Händler) bereitstellen. Jetzt muss ich diese Daten intern analysieren (zur Verbesserung des Algorithmus, zur ...
Geschwindigkeitsoptimierte Klassifizierung in Matlab
Ich habe ein Bild mit der Größe RGBuint8(576,720,3) wo ich jedes Pixel einer Reihe von Farben zuordnen möchte. Ich habe mit @ transformiergb2lab aus dem RGB-Raum in den LAB-Raum und entfernte dann die L-Ebene, sodass sie jetzt ein ...
R: unklares Verhalten der tuneRF-Funktion (randomForest-Paket)
Ich fühle mich unwohl mit der Bedeutung desstepFactor Parameter destuneRF [http://www.inside-r.org/packages/cran/randomForest/docs/tuneRF] -Funktion, mit der das @ eingestellt wimtry -Parameter, der im @ -Parameter weiter verwendet ...