Resultados de la búsqueda a petición "missing-data"

2 la respuesta

Valor perdido en el análisis de datos

Tengo un conjunto de datos en el que la variable GÉNERO que contiene dos niveles Masculino (M) y Femenino (F) tiene muchos valores faltantes. ¿Cómo trato con el valor perdido? ¿Cuáles son los diferentes métodos para manejar estos ...

1 la respuesta

Fusionar parcialmente dos conjuntos de datos y completar NA en R

Tengo dos conjuntos de datos a = conjunto de datos sin procesar con miles de observaciones de diferentes eventos climáticos STATE EVTYPE 1 AL WINTER STORM 2 AL TORNADO 3 AL TSTM WIND 4 AL TSTM WIND 5 AL TSTM WIND 6 AL HAIL 7 AL HIGH WIND 8 AL ...

2 la respuesta

Calcule la media de cada columna ignorando los datos faltantes con awk

Tengo una gran tabla de datos separados por tabulaciones con miles de filas y docenas de columnas y me faltan datos marcados como "na". Por ejemplo, na 0.93 na 0 na 0.51 1 1 na 1 na 1 1 1 na 0.97 na 1 0.92 1 na 1 0.01 0.34Me gustaría calcular la ...

3 la respuesta

No se puede soltar NAN con dropna en pandas

Importo pandas como pd y ejecuto el siguiente código y obtengo el siguiente resultado Código: traindataset = pd.read_csv('/Users/train.csv') print traindataset.dtypes print traindataset.shape print traindataset.iloc[25,3] ...

3 la respuesta

Cómo insertar observaciones faltantes en un marco de datos

Tengo datos que son observaciones a lo largo del tiempo. Desafortunadamente, faltan algunos grandes intervalos de tiempo en un tratamiento. No están codificados como NA y si hago una trama de ellos se hace evidente. [/imgs/wmppL.jpg] Mi marco ...

2 la respuesta

R- crea una nueva variable de marco de datos a partir del subconjunto de dos variables con datos faltantes NA

Tengo un marco de datos de ejemplo simple con dos columnas de datos (data1 y data2) y dos variables de agrupación (Medida 1 y 2). Las medidas 1 y 2 tienen datos faltantes NA. d <- data.frame(Measure1 = 1:2, Measure2 = 3:4, data1 = 1:10, data2 = ...

1 la respuesta

Reemplazar nulos en DataFrame con Max en fila

¿Hay alguna manera (más eficiente que usar un bucle for) para reemplazar todos los nulos en un DataFrame de Pandas con el valor máximo en su fila respectiva.

1 la respuesta

Complete los valores de fecha faltantes en la columna agregando el intervalo de entrega a otra columna de fecha

Datos: DB1 <- data.frame(orderItemID = 1:10, orderDate = c("2013-01-21","2013-03-31","2013-04-12","2013-06-01","2014-01-01", "2014-02-19","2014-02-27","2014-10-02","2014-10-31","2014-11-21"), deliveryDate = c("2013-01-23", "2013-03-01", "NA", ...

2 la respuesta

Cómo manejar los NaN faltantes para el aprendizaje automático en python

¿Cómo manejar los valores faltantes en los conjuntos de datos antes de aplicar el algoritmo de aprendizaje automático? Me di cuenta de que no es inteligente descartar los valores NAN faltantes. Por lo general, hago interpolar (calcular la media) ...

5 la respuesta

Inserte NA aleatoriamente en el marco de datos proporcionalmente

Tengo un marco de datos completo. Quiero que el 20% de los valores en el marco de datos sean reemplazados por NA para simular datos faltantes al azar. A <- c(1:10) B <- c(11:20) C <- c(21:30) df<- data.frame(A,B,C)¿Alguien puede sugerir una ...