Suchergebnisse für Anfrage "data-mining"

1 die antwort

dbscan - Einstellungslimit für die maximale Clusterspanne

Nach meinem Verständnis von DBSCAN können Sie ein Epsilon von beispielsweise 100 Metern und - angeben, da DBSCAN berücksichtigtDichte-Erreichbarkeit undnicht...

2 die antwort

Wie würde man die Kernel-Dichteschätzung als 1D-Clustering-Methode in scikit learn verwenden?

Ich muss einen einfachen univariaten Datensatz in eine voreingestellte Anzahl von Clustern gruppieren. Technisch wäre es dem Binning oder Sortieren der Daten näher, da es nur 1D ist, aber mein Chef nennt es Clustering, also werde ich mich an ...

12 die antwort

Text Mining mit PHP [geschlossen]

Ich mache ein Projekt für eine College-Klasse, die ich nehme. Ich benutze PHP, um eine einfache Web-App zu erstellen, die Tweets basierend auf einer Reihe von Wörterbüchern als "positiv" (oder glücklich) und "negativ" (oder traurig) ...

TOP-Veröffentlichungen

5 die antwort

Wählen Sie eps und minpts für DBSCAN (R)?

Ich habe eine ganze Weile nach einer Antwort auf diese Frage gesucht und hoffe, dass mir jemand helfen kann. Ich verwende Dbscan aus der FPC-Bibliothek in R....

2 die antwort

Wie analysiere ich eine dünne Adjazenzmatrix?

Ich untersuche spärliche Adjazenzmatrizen, bei denen die meisten Zellen Nullen sind und einige hier und da. Jede Beziehung zwischen zwei Zellen hat eine Polynombeschreibung, die sehr lang sein kann und deren Analyse manuell zeitaufwändig ist. ...

3 die antwort

Wie wählt man die 100 wichtigsten Funktionen (eine Untergruppe) aus, die nach pca am relevantesten sind?

Ich führte eine PCA mit einer 63 * 2308-Matrix durch und erhielt eine Punktzahl und eine Koeffizientenmatrix. Die Punktematrix ist 63 * 2308 und die Koeffizi...

1 die antwort

Machen Sie über die Twitter-API mithilfe von Python Tweepy ganz bestimmte Zeitanforderungen (sekundengenau)?

Ich möchte Tweets zu einem bestimmten Thema (zum Beispiel: "Krebs") mit Python Tweepy anfordern. In der Regel kann die Uhrzeit jedoch nur für einen bestimmten Tag angegeben werden, z. B. startSince = '2014-10-01' endUntil = '2014-10-02' for ...

3 die antwort

Feedback oder Verstärkung beim maschinellen Lernen nutzen?

Ich versuche, ein Klassifizierungsproblem zu lösen. Es scheint, dass viele klassische Ansätze einem ähnlichen Paradigma folgen. Das heißt, trainieren Sie ein Modell mit einem Trainingssatz und verwenden Sie es dann, um die Klassenbeschriftungen ...

3 die antwort

Architektur für die Datenbankanalyse

Wir haben eine Architektur, in der wir jedem Kunden Business Intelligence-ähnliche Dienste für seine Website (Internet-Händler) bereitstellen. Jetzt muss ich diese Daten intern analysieren (zur Verbesserung des Algorithmus, zur ...

3 die antwort

Wie gehe ich mit einer ROC-Analyse in mehreren Klassen in R (pROC-Paket) um?