scikit-dowiedz się, jak poznać dokumenty w klastrze?

Jestem nowicjuszem zarówno w pythonie, jak iw scikit-learn, więc proszę o cierpliwość.

Wziąłem ten kod źródłowy dla k oznacza algorytm grupowania zk oznacza grupowanie.

Następnie zmodyfikowałem, aby uruchomić na moim lokalnym zestawie przy użyciu funkcji load_file.

Chociaż algorytm kończy się, ale nie wytwarza żadnych wyników, takich jak te, które są zgrupowane razem.

Odkryłem, że obiekt km ma tablicę „km.label”, która zawiera identyfikator centroidu każdego dokumentu.

Posiada również wektor centroid z „km.cluster_centers_”

Ale jaki jest dokument? Muszę go zmapować na „zbiór danych”, który jest obiektem „Bunch”.

Jeśli drukuję dataset.data [0], otrzymuję dane z pierwszego pliku, które moim zdaniem są tasowane. ale chcę tylko znać imię.

Jestem pomylony z pytaniami takimi jak Czy dokument w dataset.data [0] jest klastrowany do centoidu na km.label [0]?

Moim podstawowym problemem jest znalezienie plików, które są połączone w klastry. Jak to znaleźć?

questionAnswers(2)

yourAnswerToTheQuestion