Sklearn Kmeans parámetro confusión?
Entonces puedo corrersklearn kmeans
como el seguiente:
kmeans = KMeans(n_clusters=3,init='random',n_init=10,max_iter=500)
Pero estoy un poco confundido sobre lo que significan los parámetros
entoncesn_init
dice:
Número de veces que el algoritmo k-means se ejecutará con diferentes semillas centroides. Los resultados finales serán la mejor salida de n_init ejecuciones consecutivas en términos de inercia.
ymax_iter
dice:
Número máximo de iteraciones del algoritmo k-means para una sola ejecución.
Pero no entiendo completamente lo que eso significa. Esn_init
¿Cuántas veces los centroides se acercan a la media de los puntos, dado un conjunto inicial de centroides?
Y esmax_iter
¿Cuántas veces se ejecuta todo el algoritmo con nuevos centroides iniciales?
Entonces, por ejemplo, conmax_iter=2
,n_init=15
, kmeans elegirá los centroides iniciales, luego los moverá 15 veces y obtendrá un resultado de agrupamiento. Luego, kmeans elegirá los centroides iniciales nuevamente, moverá esos centroides 15 veces y se detendrá. Entonces, ¿elegirá el mejor agrupamiento de las dos carreras?
¡Gracias por la ayuda!
[Editar] ¿O es exactamente lo contrario de lo que tengo aquí ...?