Agrupación de texto usando Scipy Hierarchy Clustering en Python

Question

Apr 30, 2017, 03:42 PM

cluster-analysis scipy python text-mining

Agrupación de texto usando Scipy Hierarchy Clustering en Python

Tengo un corpus de texto que contiene más de 1000 artículos cada uno en una línea separada. Estoy tratando de usar Hierarchy Clustering usando Scipy en python para producir grupos de artículos relacionados. Este es el código que usé para hacer el agrupamiento

# Agglomerative Clustering
import matplotlib.pyplot as plt
import scipy.cluster.hierarchy as hac
tree = hac.linkage(X.toarray(), method="complete",metric="euclidean")
plt.clf()
hac.dendrogram(tree)
plt.show()

y obtuve esta trama

Luego corté el árbol en el tercer nivel con fcluster ()

from scipy.cluster.hierarchy import fcluster
clustering = fcluster(tree,3,'maxclust')
print(clustering)

y obtuve esta salida: [2 2 2 ..., 2 2 2]

Mi pregunta es ¿cómo puedo encontrar las 10 palabras más frecuentes en cada grupo para sugerir un tema para cada grupo?

Respuestas a la pregunta(1)

Preguntas populares

0 la respuesta

Cómo resolver el problema de las comillas simples en el valor del archivador usando DataTable.Select ()

0 la respuesta

Carga JQuery en cualquier página usando Firebug

0 la respuesta

La ejecución de Capybara sin rack produce errores cuando se utilizan parámetros de url

0 la respuesta

"Text-decoration" y el pseudo-elemento ": after" [duplicado]

0 la respuesta

Un extraño error de C ++: test.cpp: 15: error: pasar "const *" como "este" argumento de "*" descarta calificadores

¡Eres muy activo! ¡Es genial!

Agrupación de texto usando Scipy Hierarchy Clustering en Python

Respuestas a la pregunta(1)

Su respuesta a la pregunta

Preguntas populares