Suchergebnisse für Anfrage "data-mining"

12 die antwort

Text Mining mit PHP [geschlossen]

Ich mache ein Projekt für eine College-Klasse, die ich nehme. Ich benutze PHP, um eine einfache Web-App zu erstellen, die Tweets basierend auf einer Reihe von Wörterbüchern als "positiv" (oder glücklich) und "negativ" (oder traurig) ...

10 die antwort

'Ähnlichkeit' in Data Mining

Gibt es im Bereich Data Mining eine bestimmte Unterdisziplin namens "Ähnlichkeit"? Wenn ja, womit befasst es sich? Beispiele, Links und Verweise sind hilfreich. Auch, da ich neu in diesem Bereich bin, möchte ich die Meinung der Community dazu, ...

4 die antwort

Python, Web Log Data Mining für häufige Muster

ch muss ein Tool für das Web Log Data Mining entwickel Mit vielen Abfolgen von URLs, die in einer bestimmten Benutzersitzung angefordert wurden (aus Webanwendungsprotokollen abgerufen), muss ich die Verwendungsmuster und Gruppen (Cluster) von ...

TOP-Veröffentlichungen

6 die antwort

GBM R-Funktion: Variable Wichtigkeit für jede Klasse separat erhalten

Ich benutze das gbm [http://www.inside-r.org/packages/cran/gbm/docs/gbm] -Funktion in R (gbm-Paket) zur Anpassung an stochastische Gradientenverstärkungsmodelle für die Klassifizierung mehrerer Klassen. Ich versuche einfach, die Wichtigkeit ...

12 die antwort

Wege zur Berechnung der Ähnlichkeit

Ich mache eine Community-Website, auf der ich die Ähnlichkeit zwischen zwei Benutzern berechnen muss. Jeder Benutzer wird mit den folgenden Attributen beschrieben: Alter, Hauttyp (fettig, trocken), Haartyp (lang, kurz, mittel), ...

2 die antwort

Wie analysiere ich eine dünne Adjazenzmatrix?

Ich untersuche spärliche Adjazenzmatrizen, bei denen die meisten Zellen Nullen sind und einige hier und da. Jede Beziehung zwischen zwei Zellen hat eine Polynombeschreibung, die sehr lang sein kann und deren Analyse manuell zeitaufwändig ist. ...

6 die antwort

clustering auf sehr großer spärlicher Matrix?

Ich versuche, auf einer sehr großen Matrix ein (k-means) Clustering durchzuführen. Die Matrix ist ungefähr 500000 Zeilen x 4000 Spalten groß und dennoch sehr dünn (nur ein paar "1" -Werte pro Zeile). Ich möchte ungefähr 2000 Cluster ...

4 die antwort

DBSCAN-Fehler mit Cosinus-Metrik in Python

Ich habe versucht, den DBSCAN-Algorithmus aus der Scikit-Learn-Bibliothek mit der Cosinus-Metrik zu verwenden, aber der Fehler blieb bestehen. Die Codezeile ist db = DBSCAN(eps=1, min_samples=2, metric='cosine').fit(X)woX ist eincsr_matrix. Der ...

2 die antwort

Wie würde man die Kernel-Dichteschätzung als 1D-Clustering-Methode in scikit learn verwenden?

Ich muss einen einfachen univariaten Datensatz in eine voreingestellte Anzahl von Clustern gruppieren. Technisch wäre es dem Binning oder Sortieren der Daten näher, da es nur 1D ist, aber mein Chef nennt es Clustering, also werde ich mich an ...

6 die antwort

Wie finde ich heraus, ob ein Satz eine Frage ist (fragend)?

Gibt es eine Open-Source-Java-Bibliothek / einen Open-Source-Java-Algorithmus, um herauszufinden, ob ein bestimmter Text eine Frage ist oder nicht? ch arbeite an einem Fragebeantwortungssystem, das analysieren muss, ob der vom Benutzer ...