Resultados de la búsqueda a petición "missing-data"
Valor perdido en el análisis de datos
Tengo un conjunto de datos en el que la variable GÉNERO que contiene dos niveles Masculino (M) y Femenino (F) tiene muchos valores faltantes. ¿Cómo trato con el valor perdido? ¿Cuáles son los diferentes métodos para manejar estos ...
Fusionar parcialmente dos conjuntos de datos y completar NA en R
Tengo dos conjuntos de datos a = conjunto de datos sin procesar con miles de observaciones de diferentes eventos climáticos STATE EVTYPE 1 AL WINTER STORM 2 AL TORNADO 3 AL TSTM WIND 4 AL TSTM WIND 5 AL TSTM WIND 6 AL HAIL 7 AL HIGH WIND 8 AL ...
Calcule la media de cada columna ignorando los datos faltantes con awk
Tengo una gran tabla de datos separados por tabulaciones con miles de filas y docenas de columnas y me faltan datos marcados como "na". Por ejemplo, na 0.93 na 0 na 0.51 1 1 na 1 na 1 1 1 na 0.97 na 1 0.92 1 na 1 0.01 0.34Me gustaría calcular la ...
No se puede soltar NAN con dropna en pandas
Importo pandas como pd y ejecuto el siguiente código y obtengo el siguiente resultado Código: traindataset = pd.read_csv('/Users/train.csv') print traindataset.dtypes print traindataset.shape print traindataset.iloc[25,3] ...
Cómo insertar observaciones faltantes en un marco de datos
Tengo datos que son observaciones a lo largo del tiempo. Desafortunadamente, faltan algunos grandes intervalos de tiempo en un tratamiento. No están codificados como NA y si hago una trama de ellos se hace evidente. [/imgs/wmppL.jpg] Mi marco ...
R- crea una nueva variable de marco de datos a partir del subconjunto de dos variables con datos faltantes NA
Tengo un marco de datos de ejemplo simple con dos columnas de datos (data1 y data2) y dos variables de agrupación (Medida 1 y 2). Las medidas 1 y 2 tienen datos faltantes NA. d <- data.frame(Measure1 = 1:2, Measure2 = 3:4, data1 = 1:10, data2 = ...
Reemplazar nulos en DataFrame con Max en fila
¿Hay alguna manera (más eficiente que usar un bucle for) para reemplazar todos los nulos en un DataFrame de Pandas con el valor máximo en su fila respectiva.
Complete los valores de fecha faltantes en la columna agregando el intervalo de entrega a otra columna de fecha
Datos: DB1 <- data.frame(orderItemID = 1:10, orderDate = c("2013-01-21","2013-03-31","2013-04-12","2013-06-01","2014-01-01", "2014-02-19","2014-02-27","2014-10-02","2014-10-31","2014-11-21"), deliveryDate = c("2013-01-23", "2013-03-01", "NA", ...
Cómo manejar los NaN faltantes para el aprendizaje automático en python
¿Cómo manejar los valores faltantes en los conjuntos de datos antes de aplicar el algoritmo de aprendizaje automático? Me di cuenta de que no es inteligente descartar los valores NAN faltantes. Por lo general, hago interpolar (calcular la media) ...
Inserte NA aleatoriamente en el marco de datos proporcionalmente
Tengo un marco de datos completo. Quiero que el 20% de los valores en el marco de datos sean reemplazados por NA para simular datos faltantes al azar. A <- c(1:10) B <- c(11:20) C <- c(21:30) df<- data.frame(A,B,C)¿Alguien puede sugerir una ...