Wybór eps i minptów dla DBSCAN (R)?
Od dłuższego czasu szukam odpowiedzi na to pytanie, więc mam nadzieję, że ktoś może mi pomóc. Używam dbscan z biblioteki fpc w R. Na przykład, patrzę na zestaw danych USArrests i używam na nim dbscan w następujący sposób:
library(fpc)
ds <- dbscan(USArrests,eps=20)
Wybór eps był w tym przypadku jedynie metodą prób i błędów. Zastanawiam się jednak, czy dostępna jest funkcja lub kod umożliwiający automatyzację wyboru najlepszych eps / minptów. Wiem, że niektóre książki zalecają utworzenie wykresu k-tej posortowanej odległości od najbliższego sąsiada. Oznacza to, że oś x reprezentuje „punkty posortowane według odległości do k-tego najbliższego sąsiada”, a oś y reprezentuje „k-ty najbliższy dystans sąsiada”.
Ten typ wykresu jest pomocny przy wyborze odpowiedniej wartości dla eps i minptów. Mam nadzieję, że dostarczyłem wystarczająco dużo informacji, aby ktoś mógł mi pomóc. Chciałem zamieścić zdjęcie tego, co miałem na myśli, ale wciąż jestem nowicjuszem, więc nie mogę jeszcze opublikować obrazu.