Manejo de datos faltantes / incompletos en R: ¿hay función para enmascarar pero no eliminar NA?
Como es de esperar de un DSL dirigido al análisis de datos, R maneja muy bien los datos faltantes / incomp, lete muy bien, por ejemplo:
Muchas funciones R tienen unna.rm marcar que cuando se establece enCIERTO, elimine las NA:
>>> v = mean( c(5, NA, 6, 12, NA, 87, 9, NA, 43, 67), na.rm=T)
>>> v
(5, 6, 12, 87, 9, 43, 67)
Pero si quieres lidiar con NAantes de la llamada a la función, debe hacer algo como esto:
para eliminar cada 'NA' de un vector:
vx = vx[!is.na(a)]
para eliminar cada 'NA' de un vector y reemplazarlo con un '0':
ifelse(is.na(vx), 0, vx)
para eliminar por completo cada fila que contiene 'NA' de un marco de datos:
dfx = dfx[complete.cases(dfx),]
Todas estas funciones permanentementeeliminar 'NA' o filas con un 'NA' en ellas.
Sin embargo, a veces esto no es exactamente lo que desea: puede ser necesario hacer una copia eliminada 'NA' del marco de datos para el siguiente paso en el flujo de trabajo, pero en los pasos posteriores a menudo desea recuperar esas filas (por ejemplo, para calcular un estadística de columna sabia para una columna que tiene filas faltantes causadas por una llamada previa a 'casos completos' pero esa columna no tiene valores 'NA' en ella).
para ser lo más claro posible sobre lo que estoy buscando: python / numpy tiene una clase,matriz enmascarada, con unmáscara método, que te permiteencubrir--pero no eliminar - NA durante una llamada de función. ¿Hay una función análoga en R?