k-bedeutet leerer Cluster

Question

Jun 18, 2012, 12:23 AM

k-bedeutet leerer Cluster

Ich versuche umzusetzenk-bedeutet als Hausaufgabe. Mein Übungsblatt gibt mir folgende Bemerkung zu leeren Zentren:

Wenn während der Iterationen einem der Cluster-Zentren keine Datenpunkte zugeordnet sind, ersetzen Sie ihn durch einen zufälligen Datenpunkt.

Das verwirrt mich ein bisschen, erstens erwähnen Wikipedia oder andere Quellen, die ich lese, das überhaupt nicht. Ich habe weiter über ein Problem mit der Auswahl eines guten k für Ihre Daten gelesen. Wie soll mein Algorithmus konvergieren, wenn ich neue Zentren für Cluster einstelle, die leer sind?

Wenn ich leere Cluster ignoriere, konvergiere ich nach 30-40 Iterationen. Ist es falsch, leere Cluster zu ignorieren?