Suchergebnisse für Anfrage "data-mining"
Text Mining mit PHP [geschlossen]
Ich mache ein Projekt für eine College-Klasse, die ich nehme. Ich benutze PHP, um eine einfache Web-App zu erstellen, die Tweets basierend auf einer Reihe von Wörterbüchern als "positiv" (oder glücklich) und "negativ" (oder traurig) ...
'Ähnlichkeit' in Data Mining
Gibt es im Bereich Data Mining eine bestimmte Unterdisziplin namens "Ähnlichkeit"? Wenn ja, womit befasst es sich? Beispiele, Links und Verweise sind hilfreich. Auch, da ich neu in diesem Bereich bin, möchte ich die Meinung der Community dazu, ...
Python, Web Log Data Mining für häufige Muster
ch muss ein Tool für das Web Log Data Mining entwickel Mit vielen Abfolgen von URLs, die in einer bestimmten Benutzersitzung angefordert wurden (aus Webanwendungsprotokollen abgerufen), muss ich die Verwendungsmuster und Gruppen (Cluster) von ...
GBM R-Funktion: Variable Wichtigkeit für jede Klasse separat erhalten
Ich benutze das gbm [http://www.inside-r.org/packages/cran/gbm/docs/gbm] -Funktion in R (gbm-Paket) zur Anpassung an stochastische Gradientenverstärkungsmodelle für die Klassifizierung mehrerer Klassen. Ich versuche einfach, die Wichtigkeit ...
Wege zur Berechnung der Ähnlichkeit
Ich mache eine Community-Website, auf der ich die Ähnlichkeit zwischen zwei Benutzern berechnen muss. Jeder Benutzer wird mit den folgenden Attributen beschrieben: Alter, Hauttyp (fettig, trocken), Haartyp (lang, kurz, mittel), ...
Wie analysiere ich eine dünne Adjazenzmatrix?
Ich untersuche spärliche Adjazenzmatrizen, bei denen die meisten Zellen Nullen sind und einige hier und da. Jede Beziehung zwischen zwei Zellen hat eine Polynombeschreibung, die sehr lang sein kann und deren Analyse manuell zeitaufwändig ist. ...
clustering auf sehr großer spärlicher Matrix?
Ich versuche, auf einer sehr großen Matrix ein (k-means) Clustering durchzuführen. Die Matrix ist ungefähr 500000 Zeilen x 4000 Spalten groß und dennoch sehr dünn (nur ein paar "1" -Werte pro Zeile). Ich möchte ungefähr 2000 Cluster ...
DBSCAN-Fehler mit Cosinus-Metrik in Python
Ich habe versucht, den DBSCAN-Algorithmus aus der Scikit-Learn-Bibliothek mit der Cosinus-Metrik zu verwenden, aber der Fehler blieb bestehen. Die Codezeile ist db = DBSCAN(eps=1, min_samples=2, metric='cosine').fit(X)woX ist eincsr_matrix. Der ...
Wie würde man die Kernel-Dichteschätzung als 1D-Clustering-Methode in scikit learn verwenden?
Ich muss einen einfachen univariaten Datensatz in eine voreingestellte Anzahl von Clustern gruppieren. Technisch wäre es dem Binning oder Sortieren der Daten näher, da es nur 1D ist, aber mein Chef nennt es Clustering, also werde ich mich an ...
Wie finde ich heraus, ob ein Satz eine Frage ist (fragend)?
Gibt es eine Open-Source-Java-Bibliothek / einen Open-Source-Java-Algorithmus, um herauszufinden, ob ein bestimmter Text eine Frage ist oder nicht? ch arbeite an einem Fragebeantwortungssystem, das analysieren muss, ob der vom Benutzer ...