Suchergebnisse für Anfrage "data-mining"

1 die antwort

Informationsgewinnberechnung für eine Textdatei?

Ich arbeite anTextkategorisierung unter Verwendung von Informationsgewinn, PCA und genetischem AlgorithmusAber nach dem AuftrittVorverarbeitung(Stemming, Stopword Removal, TFIDF) auf dem Dokument m verwirrt, wie man voranschreitet, ...

4 die antwort

Implementierung des k-means Clustering Algorithmus

In meinem Programm nehme ich k = 2 für den k-Mittelwert-Algorithmus, d. H. Ich möchte nur 2 Cluster. Ich habe es sehr einfach und unkompliziert implementiert, aber ich kann immer noch nicht verstehen, warum mein Programm in eine Endlosschleife ...

2 die antwort

Verwenden Sie die absolute Pearson-Korrelation als Abstand im K-Means-Algorithmus (MATLAB)

Ich muss einige Cluster mithilfe einer Korrelationsentfernung erstellen, aber anstelle der integrierten 'Entfernung' 'Korrelation', die als d = 1-ri definiert ist, muss die absolute Pearson-Entfernung verwendet werden. In meiner Anwendung sollten ...

TOP-Veröffentlichungen

3 die antwort

Clustering eines sehr großen Datensatzes in R

Ich habe einen Datensatz bestehend aus 70.000 numerischen Werten, die Entfernungen von 0 bis 50 darstellen, und ich möchte diese Zahlen gruppieren. Wenn ich jedoch den klassischen Clustering-Ansatz versuche, müsste ich eine Distanzmatrix von ...

3 die antwort

Feedback oder Verstärkung beim maschinellen Lernen nutzen?

Ich versuche, ein Klassifizierungsproblem zu lösen. Es scheint, dass viele klassische Ansätze einem ähnlichen Paradigma folgen. Das heißt, trainieren Sie ein Modell mit einem Trainingssatz und verwenden Sie es dann, um die Klassenbeschriftungen ...

1 die antwort

Verwendung der Distanzfunktion von ELKI

Dies ist eine Fortsetzung von avorherige Frage [https://stackoverflow.com/questions/23634614/running-dbscan-in-elki/23639300?noredirect=1#23639300] , wo wir bemerkten, dass die Verwendung von euklidischen Abständen mit lat. langen Koordinaten ...

1 die antwort

Machen Sie über die Twitter-API mithilfe von Python Tweepy ganz bestimmte Zeitanforderungen (sekundengenau)?

Ich möchte Tweets zu einem bestimmten Thema (zum Beispiel: "Krebs") mit Python Tweepy anfordern. In der Regel kann die Uhrzeit jedoch nur für einen bestimmten Tag angegeben werden, z. B. startSince = '2014-10-01' endUntil = '2014-10-02' for ...

3 die antwort

Architektur für die Datenbankanalyse

Wir haben eine Architektur, in der wir jedem Kunden Business Intelligence-ähnliche Dienste für seine Website (Internet-Händler) bereitstellen. Jetzt muss ich diese Daten intern analysieren (zur Verbesserung des Algorithmus, zur ...

4 die antwort

Geschwindigkeitsoptimierte Klassifizierung in Matlab

Ich habe ein Bild mit der Größe RGBuint8(576,720,3) wo ich jedes Pixel einer Reihe von Farben zuordnen möchte. Ich habe mit @ transformiergb2lab aus dem RGB-Raum in den LAB-Raum und entfernte dann die L-Ebene, sodass sie jetzt ein ...

2 die antwort

R: unklares Verhalten der tuneRF-Funktion (randomForest-Paket)

Ich fühle mich unwohl mit der Bedeutung desstepFactor Parameter destuneRF [http://www.inside-r.org/packages/cran/randomForest/docs/tuneRF] -Funktion, mit der das @ eingestellt wimtry -Parameter, der im @ -Parameter weiter verwendet ...