scikit-dowiedz się, jak poznać dokumenty w klastrze?

Question

Jul 22, 2013, 03:07 PM

Jestem nowicjuszem zarówno w pythonie, jak iw scikit-learn, więc proszę o cierpliwość.

Wziąłem ten kod źródłowy dla k oznacza algorytm grupowania zk oznacza grupowanie.

Następnie zmodyfikowałem, aby uruchomić na moim lokalnym zestawie przy użyciu funkcji load_file.

Chociaż algorytm kończy się, ale nie wytwarza żadnych wyników, takich jak te, które są zgrupowane razem.

Odkryłem, że obiekt km ma tablicę „km.label”, która zawiera identyfikator centroidu każdego dokumentu.

Posiada również wektor centroid z „km.cluster_centers_”

Ale jaki jest dokument? Muszę go zmapować na „zbiór danych”, który jest obiektem „Bunch”.

Jeśli drukuję dataset.data [0], otrzymuję dane z pierwszego pliku, które moim zdaniem są tasowane. ale chcę tylko znać imię.

Jestem pomylony z pytaniami takimi jak Czy dokument w dataset.data [0] jest klastrowany do centoidu na km.label [0]?

Moim podstawowym problemem jest znalezienie plików, które są połączone w klastry. Jak to znaleźć?

questionAnswers(2)

E-mail jest wysyłany do spamu zamiast do skrzynki odbiorczej

Szybka implementacja n-gramów znaków za pomocą Pythona

Otrzymuj i łącz SMS-y ponad 160 znaków w Androidzie

Funkcja modyfikująca ciąg znaków

JProgressBar w nowym wątku JDialog