Лучшее решение для неизвестной (по статистической модели параметров и т. Д.) Проблемы ML - это выборка данных и поиск параметров, наиболее подходящих для подзадачи, а затем их использование для решения полной задачи. В этом случае выберите лучший K для 5% данных.
жные дубликаты:
Как оптимизировать K в алгоритме K - средних
Как определить k при использовании кластеризации k-средних?
В зависимости от статистических показателей, можем ли мы выбрать K. Как стандартное отклонение, среднее значение, дисперсия и т. Д., Или
Есть ли какой-нибудь простой способ выбрать K в алгоритме K-средних?
Заранее спасибо Навин