agrupamiento con valores de NA en R
Me sorprendió descubrir queclara
desdelibrary(cluster)
permite NAs. Pero la documentación de la función no dice nada sobre cómo maneja estos valores.
Así que mis preguntas son:
Cómoclara
maneja NAs?¿Puede esto ser usado de alguna manera parakmeans
(Nas no permitido)?[Actualizar] Así que encontré líneas de código enclara
función:
inax <- is.na(x)
valmisdat <- 1.1 * max(abs(range(x, na.rm = TRUE)))
x[inax] <- valmisdat
que hacen falta reemplazo de valor porvalmisdat
. No estoy seguro de entender la razón para usar tal fórmula. ¿Algunas ideas? ¿Sería más "natural" tratar las NA por cada columna por separado, tal vez reemplazando con media / mediana?