Suchergebnisse für Anfrage "data-mining"
Error in do_one (nmeth): NA / NaN / Inf im fremden Funktionsaufruf (arg 1)
Ich habe eine Datentabelle ("Norm"), die numerische - zumindest soweit ich sie sehen kann - normalisierte Werte der folgenden Form enthält: Wenn ich ausführe k <- kmeans(norm,center=3) Ich erhalte folgenden Fehler: Error in do_one(nmeth) : ...
Wie würde man die Kernel-Dichteschätzung als 1D-Clustering-Methode in scikit learn verwenden?
Ich muss einen einfachen univariaten Datensatz in eine voreingestellte Anzahl von Clustern gruppieren. Technisch wäre es dem Binning oder Sortieren der Daten näher, da es nur 1D ist, aber mein Chef nennt es Clustering, also werde ich mich an ...
DBSCAN-Fehler mit Cosinus-Metrik in Python
Ich habe versucht, den DBSCAN-Algorithmus aus der Scikit-Learn-Bibliothek mit der Cosinus-Metrik zu verwenden, aber der Fehler blieb bestehen. Die Codezeile ist db = DBSCAN(eps=1, min_samples=2, metric='cosine').fit(X)woX ist eincsr_matrix. Der ...
Wie analysiere ich eine dünne Adjazenzmatrix?
Ich untersuche spärliche Adjazenzmatrizen, bei denen die meisten Zellen Nullen sind und einige hier und da. Jede Beziehung zwischen zwei Zellen hat eine Polynombeschreibung, die sehr lang sein kann und deren Analyse manuell zeitaufwändig ist. ...
GBM R-Funktion: Variable Wichtigkeit für jede Klasse separat erhalten
Ich benutze das gbm [http://www.inside-r.org/packages/cran/gbm/docs/gbm] -Funktion in R (gbm-Paket) zur Anpassung an stochastische Gradientenverstärkungsmodelle für die Klassifizierung mehrerer Klassen. Ich versuche einfach, die Wichtigkeit ...
R: unklares Verhalten der tuneRF-Funktion (randomForest-Paket)
Ich fühle mich unwohl mit der Bedeutung desstepFactor Parameter destuneRF [http://www.inside-r.org/packages/cran/randomForest/docs/tuneRF] -Funktion, mit der das @ eingestellt wimtry -Parameter, der im @ -Parameter weiter verwendet ...
Geschwindigkeitsoptimierte Klassifizierung in Matlab
Ich habe ein Bild mit der Größe RGBuint8(576,720,3) wo ich jedes Pixel einer Reihe von Farben zuordnen möchte. Ich habe mit @ transformiergb2lab aus dem RGB-Raum in den LAB-Raum und entfernte dann die L-Ebene, sodass sie jetzt ein ...
Machen Sie über die Twitter-API mithilfe von Python Tweepy ganz bestimmte Zeitanforderungen (sekundengenau)?
Ich möchte Tweets zu einem bestimmten Thema (zum Beispiel: "Krebs") mit Python Tweepy anfordern. In der Regel kann die Uhrzeit jedoch nur für einen bestimmten Tag angegeben werden, z. B. startSince = '2014-10-01' endUntil = '2014-10-02' for ...
scikit-learn: Clustering von Textdokumenten mit DBSCAN
Ich versuche, mit scikit-learn Textdokumente zu gruppieren. Im Großen und Ganzen finde ich mich zurecht, aber ich habe meine Probleme mit bestimmten Problemen. Die meisten der gefundenen Beispiele veranschaulichen das Clustering mithilfe von ...
Kosinusabstand als Vektorabstandsfunktion für k-Mittel
Ich habe ein Diagramm mit N Eckpunkten, wobei jeder Eckpunkt einen Ort darstellt. Außerdem habe ich Vektoren, einen pro Benutzer, für jeden der N Koeffizienten, wobei der Koeffizientenwert die Dauer in Sekunden ist, die am entsprechenden Ort ...