eichnen Sie ein Dokument in ein 2D-Diagram

Ich möchte ein 2D-Diagramm mit der X-Achse als Term und der Y-Achse als TFIDF-Score (oder Dokument-ID) für meine Liste von Sätzen zeichnen. Ich habe scikit learn's fit_transform () verwendet, um die Scipy-Matrix zu erhalten, aber ich weiß nicht, wie ich diese Matrix zum Zeichnen des Graphen verwenden soll. Ich versuche einen Plot zu bekommen, um zu sehen, wie gut sich meine Sätze anhand von Kilometern klassifizieren lassen.

Hier ist die Ausgabe vonfit_transform(sentence_list):

(Dokument-ID, Term-Nummer) tfidf score

(0, 1023)   0.209291711271
(0, 924)    0.174405532933
(0, 914)    0.174405532933
(0, 821)    0.15579574484
(0, 770)    0.174405532933
(0, 763)    0.159719994016
(0, 689)    0.135518787598

Hier ist mein Code:

sentence_list=["Hi how are you", "Good morning" ...]
vectorizer=TfidfVectorizer(min_df=1, stop_words='english', decode_error='ignore')
vectorized=vectorizer.fit_transform(sentence_list)
num_samples, num_features=vectorized.shape
print "num_samples:  %d, num_features: %d" %(num_samples,num_features)
num_clusters=10
km=KMeans(n_clusters=num_clusters, init='k-means++',n_init=10, verbose=1)
km.fit(vectorized)
PRINT km.labels_   # Returns a list of clusters ranging 0 to 10 

Vielen Dank

Antworten auf die Frage(4)

Ihre Antwort auf die Frage