Agrupación de texto usando Scipy Hierarchy Clustering en Python

Tengo un corpus de texto que contiene más de 1000 artículos cada uno en una línea separada. Estoy tratando de usar Hierarchy Clustering usando Scipy en python para producir grupos de artículos relacionados. Este es el código que usé para hacer el agrupamiento

# Agglomerative Clustering
import matplotlib.pyplot as plt
import scipy.cluster.hierarchy as hac
tree = hac.linkage(X.toarray(), method="complete",metric="euclidean")
plt.clf()
hac.dendrogram(tree)
plt.show() 

y obtuve esta trama

Luego corté el árbol en el tercer nivel con fcluster ()

from scipy.cluster.hierarchy import fcluster
clustering = fcluster(tree,3,'maxclust')
print(clustering)

y obtuve esta salida: [2 2 2 ..., 2 2 2]

Mi pregunta es ¿cómo puedo encontrar las 10 palabras más frecuentes en cada grupo para sugerir un tema para cada grupo?

Respuestas a la pregunta(1)

Su respuesta a la pregunta