Clustering mit NA-Werten in R
Ich war überrascht, das herauszufindenclara
vonlibrary(cluster)
erlaubt NAs. Die Funktionsdokumentation sagt jedoch nichts darüber aus, wie mit diesen Werten umgegangen wird.
Meine Fragen sind also:
Wieclara
behandelt NAs?Kann das irgendwie genutzt werden fürkmeans
(Nas nicht erlaubt)?[Aktualisieren] Also habe ich Codezeilen in gefundenclara
Funktion:
inax <- is.na(x)
valmisdat <- 1.1 * max(abs(range(x, na.rm = TRUE)))
x[inax] <- valmisdat
die tun fehlenden wert ersatz durchvalmisdat
. Ich bin mir nicht sicher, warum ich eine solche Formel verwende. Irgendwelche Ideen? Wäre es "natürlicher", NAs für jede Spalte einzeln zu behandeln, möglicherweise durch Mittelwert / Median zu ersetzen?