Resultados de la búsqueda a petición "data-manipulation"

1 la respuesta

PHP XMLReader lee, edita el nodo, escribe XMLWriter

Tengo un archivo XML que es muy grande (millones de registros). Debido a las limitaciones de velocidad y memoria que planeo usar

1 la respuesta

¿Cómo filtrar (con dplyr) todos los valores de un grupo si se alcanza el límite variable?

Aquí están los datos ficticios: cases <- rep(1:5,times=2) var1 <- as.numeric(c(450,100,250,999,200,500,980,10,700,1000)) var2 <- as.numeric(c(111,222,333,444,424,634,915,12,105,152)) maindata1 <- data.frame(cases,var1,var2) df1 <- maindata1 %>% ...

1 la respuesta

Promedio del subgrupo de la segunda columna, agrupado por la primera columna

Supongamos que tengo la matriz A. La primera columna es "grupo". Entonces quiero calcular el promedio de la segunda columna para cada grupo. Entonces quiero crear B. A= 1 2 1 3 2 4 2 2 B= 1 2.5 2 3Lo mejor que hice hasta ahora es construir ...

1 la respuesta

Reemplace cada elemento igual a cero de una matriz con el elemento correspondiente de la fila de arriba

Estoy usando R. Tengo una matriz y quiero reemplazar cada elemento igual a cero con el elemento correspondiente de la fila de arriba. Por ejemplo, creé la siguiente matriz: AA <- matrix(c(1,2,3,1,4,5,1,0,2), ncol=3, nrow=3) [,1] [,2] [,3] [1,] ...

1 la respuesta

Lectura de csv de pandas que tienen quotechar y delimitador para un valor de columna

Aquí está el contenido de un archivo csv 'test.csv', estoy tratando de leerlo a través de pandas read_csv () "col1", "col2", "col3", "col4" "v1", "v2", "v3", "v4" "v21", "v22", "v23", "this, "creating, what to do? " problems"Este es el comando ...

1 la respuesta

pandas reset_index después de groupby.value_counts ()

Estoy tratando de agrupar por una columna y calcular el recuento de valores en otra columna. import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2], 'Amt':[20,20,20,30,30,30,30,40, 40,10, 10, 40,40,40]}) ...

1 la respuesta

obtener los valores primero y último en el grupo - dplyr group_by con last () y first ()

El siguiente código debe agrupar los datos por año y luego crear dos nuevas columnas con el primer y el último valor de cada año. library(dplyr) set.seed(123) d <- data.frame( group = rep(1:3, each = 3), year = rep(seq(2000,2002,1),3), value = ...

1 la respuesta

pandas se fusionan en el tema de la columna de fecha

Estoy tratando de fusionar dos marcos de datos en la columna de fecha (probé ambos como tipoobject odatetime.date, pero no puede proporcionar la salida de fusión deseada: import pandas as pd df1 = pd.DataFrame({'amt': {0: 1549367.9496070854, ...

1 la respuesta

Manupilando datos del mes anterior según el mes actual

Tengo un nombre de tabla Prv_Data que contiene el mes anterior del informe, que tiene la columna Report_Id y Timeline. Prv_Data -> Report_ID | Timeline ---------------|-------------- 01 | Weekly @Mon 01 | Weekly @Mon 01 | Weekly @Mon 01 | Weekly ...

1 la respuesta

R: crea un marco de datos desde una ventana móvil

Vamos a decir que tengo un marco de datos con la siguiente estructura: DF <- data.frame(x = 0:4, y = 5:9) > DF x y 1 0 5 2 1 6 3 2 7 4 3 8 5 4 9 cuál es la forma más eficiente de convertir 'DF' en un marco de datos con la siguiente ...