Как применить алгоритм DBSCAN к группировке похожих ссылок [закрыто]

Как сгруппировать похожие URL с помощью алгоритма DBSCAN. Я видел много наборов данных, но ни одного из них не было по URL, я хочу взять похожие типы URL и сгруппировать их вместе. Здесь я не могу знать расстояние (eps) и minpoints может быть количеством URL, которые будут сгруппированы.