grupowanie z wartościami NA w R
Byłem zaskoczony, że się tego dowiedziałemclara
zlibrary(cluster)
zezwala NA. Ale dokumentacja funkcji nie mówi nic o tym, jak obsługuje te wartości.
Moje pytania to:
W jaki sposóbclara
obsługuje NA?Czy można do tego jakoś wykorzystaćkmeans
(Nas niedozwolone)?[Aktualizacja] Więc znalazłem linie kodu wclara
funkcjonować:
inax <- is.na(x)
valmisdat <- 1.1 * max(abs(range(x, na.rm = TRUE)))
x[inax] <- valmisdat
które zastępują brakujące wartościvalmisdat
. Nie jestem pewien, czy rozumiem powód użycia takiej formuły. Jakieś pomysły? Czy byłoby bardziej „naturalne” traktowanie NA według każdej kolumny osobno, może zastąpienie średniej / mediany?