Confusão de parâmetros do Sklearn Kmeans?
Para que eu possa corrersklearn kmeans
como o seguinte:
kmeans = KMeans(n_clusters=3,init='random',n_init=10,max_iter=500)
Mas estou um pouco confuso sobre o que os parâmetros significam
tãon_init
diz:
Número de vezes que o algoritmo k-means será executado com diferentes sementes de centróide. Os resultados finais serão a melhor saída de n_init execuções consecutivas em termos de inércia.
emax_iter
diz:
Número máximo de iterações do algoritmo k-means para uma única execução.
Mas não entendo completamente o que isso significa. Én_init
o número de vezes que os centróides se aproximam da média dos pontos, dado um conjunto inicial de centróides?
E émax_iter
o número de vezes que todo o algoritmo é executado com novos centróides iniciais?
Então, por exemplo, commax_iter=2
,n_init=15
, o kmeans escolherá os centróides iniciais, depois os moverá 15 vezes e obterá um resultado de agrupamento. Os kmeans escolherão os centróides iniciais novamente, moverão esses centróides 15 vezes e pararão. Então, ele escolherá a melhor confusão entre as duas corridas?
Obrigado pela ajuda!
[Editar] Ou é exatamente o oposto do que tenho aqui ...?