Suchergebnisse für Anfrage "data-mining"
dbscan - Einstellungslimit für die maximale Clusterspanne
Nach meinem Verständnis von DBSCAN können Sie ein Epsilon von beispielsweise 100 Metern und - angeben, da DBSCAN berücksichtigtDichte-Erreichbarkeit undnicht...
Wie würde man die Kernel-Dichteschätzung als 1D-Clustering-Methode in scikit learn verwenden?
Ich muss einen einfachen univariaten Datensatz in eine voreingestellte Anzahl von Clustern gruppieren. Technisch wäre es dem Binning oder Sortieren der Daten näher, da es nur 1D ist, aber mein Chef nennt es Clustering, also werde ich mich an ...
Text Mining mit PHP [geschlossen]
Ich mache ein Projekt für eine College-Klasse, die ich nehme. Ich benutze PHP, um eine einfache Web-App zu erstellen, die Tweets basierend auf einer Reihe von Wörterbüchern als "positiv" (oder glücklich) und "negativ" (oder traurig) ...
Wählen Sie eps und minpts für DBSCAN (R)?
Ich habe eine ganze Weile nach einer Antwort auf diese Frage gesucht und hoffe, dass mir jemand helfen kann. Ich verwende Dbscan aus der FPC-Bibliothek in R....
Wie analysiere ich eine dünne Adjazenzmatrix?
Ich untersuche spärliche Adjazenzmatrizen, bei denen die meisten Zellen Nullen sind und einige hier und da. Jede Beziehung zwischen zwei Zellen hat eine Polynombeschreibung, die sehr lang sein kann und deren Analyse manuell zeitaufwändig ist. ...
Wie wählt man die 100 wichtigsten Funktionen (eine Untergruppe) aus, die nach pca am relevantesten sind?
Ich führte eine PCA mit einer 63 * 2308-Matrix durch und erhielt eine Punktzahl und eine Koeffizientenmatrix. Die Punktematrix ist 63 * 2308 und die Koeffizi...
Machen Sie über die Twitter-API mithilfe von Python Tweepy ganz bestimmte Zeitanforderungen (sekundengenau)?
Ich möchte Tweets zu einem bestimmten Thema (zum Beispiel: "Krebs") mit Python Tweepy anfordern. In der Regel kann die Uhrzeit jedoch nur für einen bestimmten Tag angegeben werden, z. B. startSince = '2014-10-01' endUntil = '2014-10-02' for ...
Feedback oder Verstärkung beim maschinellen Lernen nutzen?
Ich versuche, ein Klassifizierungsproblem zu lösen. Es scheint, dass viele klassische Ansätze einem ähnlichen Paradigma folgen. Das heißt, trainieren Sie ein Modell mit einem Trainingssatz und verwenden Sie es dann, um die Klassenbeschriftungen ...
Architektur für die Datenbankanalyse
Wir haben eine Architektur, in der wir jedem Kunden Business Intelligence-ähnliche Dienste für seine Website (Internet-Händler) bereitstellen. Jetzt muss ich diese Daten intern analysieren (zur Verbesserung des Algorithmus, zur ...