eichnen Sie ein Dokument in ein 2D-Diagram

Question

Jan 27, 2015, 12:00 AM

eichnen Sie ein Dokument in ein 2D-Diagram

Ich möchte ein 2D-Diagramm mit der X-Achse als Term und der Y-Achse als TFIDF-Score (oder Dokument-ID) für meine Liste von Sätzen zeichnen. Ich habe scikit learn's fit_transform () verwendet, um die Scipy-Matrix zu erhalten, aber ich weiß nicht, wie ich diese Matrix zum Zeichnen des Graphen verwenden soll. Ich versuche einen Plot zu bekommen, um zu sehen, wie gut sich meine Sätze anhand von Kilometern klassifizieren lassen.

Hier ist die Ausgabe vonfit_transform(sentence_list):

(Dokument-ID, Term-Nummer) tfidf score

(0, 1023)   0.209291711271
(0, 924)    0.174405532933
(0, 914)    0.174405532933
(0, 821)    0.15579574484
(0, 770)    0.174405532933
(0, 763)    0.159719994016
(0, 689)    0.135518787598

Hier ist mein Code:

sentence_list=["Hi how are you", "Good morning" ...]
vectorizer=TfidfVectorizer(min_df=1, stop_words='english', decode_error='ignore')
vectorized=vectorizer.fit_transform(sentence_list)
num_samples, num_features=vectorized.shape
print "num_samples:  %d, num_features: %d" %(num_samples,num_features)
num_clusters=10
km=KMeans(n_clusters=num_clusters, init='k-means++',n_init=10, verbose=1)
km.fit(vectorized)
PRINT km.labels_   # Returns a list of clusters ranging 0 to 10

Vielen Dank

Antworten auf die Frage(4)

Top Fragen

0 die antwort

Wie kann ich ein LetsEncrypt SSL-Zertifikat in meiner Heroku Node Express-App verwenden?

0 die antwort

JavaScript-Regex zum Extrahieren des Dateinamens aus dem Content-Disposition-Header

0 die antwort

Wie speichere ich einen Wert, der aus einer verschachtelten for-Schleife generiert wurde, in einem Array in Matlab?

0 die antwort

Faktorreihenfolge im facettierten Punktdiagramm mit ggplot2

0 die antwort

Wie kann ein Non-Clustered-Index eine Spalte ausgeben, die nicht im Index enthalten ist?

Du bist sehr aktiv! Es ist großartig!

eichnen Sie ein Dokument in ein 2D-Diagram

Antworten auf die Frage(4)

Ihre Antwort auf die Frage

Top Fragen