k-oznacza pusty klaster

Staram się wdrożyćk-oznacza jako zadanie domowe. Moja karta ćwiczeń zawiera następujące uwagi dotyczące pustych ośrodków:

Podczas iteracji, jeśli którykolwiek z centrów klastrów nie ma powiązanych punktów danych, zastąp go losowym punktem danych.

To trochę mnie dezorientuje, po pierwsze Wikipedia lub inne źródła, które czytam, w ogóle o tym nie wspominają. Dalej czytam o problemie z „wyborem dobrego k dla twoich danych” - w jaki sposób mój algorytm ma się zbiegać, jeśli zacznę ustawiać nowe centra dla klastra, które były puste.

Jeśli zignoruję puste klastry, zbiegam się po 30-40 iteracjach. Czy źle jest ignorować puste klastry?

questionAnswers(6)

yourAnswerToTheQuestion