k-significa cluster vazio

Question

Jun 18, 2012, 12:23 AM

k-significa cluster vazio

Eu tento implementark-significa como uma tarefa de casa. Minha ficha de exercícios me dá uma observação a respeito dos centros vazios:

Durante as iterações, se algum dos centros do cluster não tiver pontos de dados associados, substitua-o por um ponto de dados aleatório.

Isso me confunde um pouco, primeiro a Wikipedia ou outras fontes que eu li não mencionam nada disso. Além disso, li sobre um problema com 'escolher um bom k para seus dados' - como meu algoritmo deveria convergir se eu começar a configurar novos centros para cluster que estavam vazios.

Se eu ignorar clusters vazios, converjo após 30-40 iterações. É errado ignorar clusters vazios?