Resultados de la búsqueda a petición "data-manipulation"
PHP XMLReader lee, edita el nodo, escribe XMLWriter
Tengo un archivo XML que es muy grande (millones de registros). Debido a las limitaciones de velocidad y memoria que planeo usar
¿Cómo filtrar (con dplyr) todos los valores de un grupo si se alcanza el límite variable?
Aquí están los datos ficticios: cases <- rep(1:5,times=2) var1 <- as.numeric(c(450,100,250,999,200,500,980,10,700,1000)) var2 <- as.numeric(c(111,222,333,444,424,634,915,12,105,152)) maindata1 <- data.frame(cases,var1,var2) df1 <- maindata1 %>% ...
Promedio del subgrupo de la segunda columna, agrupado por la primera columna
Supongamos que tengo la matriz A. La primera columna es "grupo". Entonces quiero calcular el promedio de la segunda columna para cada grupo. Entonces quiero crear B. A= 1 2 1 3 2 4 2 2 B= 1 2.5 2 3Lo mejor que hice hasta ahora es construir ...
Reemplace cada elemento igual a cero de una matriz con el elemento correspondiente de la fila de arriba
Estoy usando R. Tengo una matriz y quiero reemplazar cada elemento igual a cero con el elemento correspondiente de la fila de arriba. Por ejemplo, creé la siguiente matriz: AA <- matrix(c(1,2,3,1,4,5,1,0,2), ncol=3, nrow=3) [,1] [,2] [,3] [1,] ...
Lectura de csv de pandas que tienen quotechar y delimitador para un valor de columna
Aquí está el contenido de un archivo csv 'test.csv', estoy tratando de leerlo a través de pandas read_csv () "col1", "col2", "col3", "col4" "v1", "v2", "v3", "v4" "v21", "v22", "v23", "this, "creating, what to do? " problems"Este es el comando ...
pandas reset_index después de groupby.value_counts ()
Estoy tratando de agrupar por una columna y calcular el recuento de valores en otra columna. import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2], 'Amt':[20,20,20,30,30,30,30,40, 40,10, 10, 40,40,40]}) ...
obtener los valores primero y último en el grupo - dplyr group_by con last () y first ()
El siguiente código debe agrupar los datos por año y luego crear dos nuevas columnas con el primer y el último valor de cada año. library(dplyr) set.seed(123) d <- data.frame( group = rep(1:3, each = 3), year = rep(seq(2000,2002,1),3), value = ...
pandas se fusionan en el tema de la columna de fecha
Estoy tratando de fusionar dos marcos de datos en la columna de fecha (probé ambos como tipoobject odatetime.date, pero no puede proporcionar la salida de fusión deseada: import pandas as pd df1 = pd.DataFrame({'amt': {0: 1549367.9496070854, ...
Manupilando datos del mes anterior según el mes actual
Tengo un nombre de tabla Prv_Data que contiene el mes anterior del informe, que tiene la columna Report_Id y Timeline. Prv_Data -> Report_ID | Timeline ---------------|-------------- 01 | Weekly @Mon 01 | Weekly @Mon 01 | Weekly @Mon 01 | Weekly ...
R: crea un marco de datos desde una ventana móvil
Vamos a decir que tengo un marco de datos con la siguiente estructura: DF <- data.frame(x = 0:4, y = 5:9) > DF x y 1 0 5 2 1 6 3 2 7 4 3 8 5 4 9 cuál es la forma más eficiente de convertir 'DF' en un marco de datos con la siguiente ...