Clustering mit NA-Werten in R

Question

May 23, 2012, 03:46 PM

Clustering mit NA-Werten in R

Ich war überrascht, das herauszufindenclara vonlibrary(cluster) erlaubt NAs. Die Funktionsdokumentation sagt jedoch nichts darüber aus, wie mit diesen Werten umgegangen wird.

Meine Fragen sind also:

Wieclara behandelt NAs?Kann das irgendwie genutzt werden fürkmeans (Nas nicht erlaubt)?

[Aktualisieren] Also habe ich Codezeilen in gefundenclara Funktion:

inax <- is.na(x)
valmisdat <- 1.1 * max(abs(range(x, na.rm = TRUE)))
x[inax] <- valmisdat

die tun fehlenden wert ersatz durchvalmisdat. Ich bin mir nicht sicher, warum ich eine solche Formel verwende. Irgendwelche Ideen? Wäre es "natürlicher", NAs für jede Spalte einzeln zu behandeln, möglicherweise durch Mittelwert / Median zu ersetzen?