Jak zastosować algorytm DBSCAN do grupowania podobnego adresu URL [zamknięte]

jak pogrupować podobny adres URL za pomocą algorytmu DBSCAN. Widziałem wiele zestawów danych, ale żaden nie znajdował się w adresie URL, chcę pobrać podobne adresy URL i zgrupować je razem. Tutaj nie jestem w stanie poznać odległości (eps), a minpunkty mogą być liczbą adresów URL do grupowania.