Resultados de la búsqueda a petición "data-manipulation"
pandas reset_index después de groupby.value_counts ()
Estoy tratando de agrupar por una columna y calcular el recuento de valores en otra columna. import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2], 'Amt':[20,20,20,30,30,30,30,40, 40,10, 10, 40,40,40]}) ...
Cómo usar la función de aplicación de pandas en todas las columnas de algunas filas del marco de datos
tengo undataframe. Quiero reemplazar los valores de todas las columnas de algunas filas a un valor predeterminado. ¿Hay alguna manera de hacer esto a través depandas apply función Aquí está el marco de datos import pandas as ...
contando después y antes del cambio de valor, dentro de los grupos, generando nuevas variables para cada turno único
Estoy trabajando para contar las ocurrencias de valores únicos dentro de mis grupos,id. Estoy mirandoTF. CuandoTF cambios Quiero contar tanto hacia adelante como hacia atrás desde ese punto. Este conteo debe almacenarse en una nueva variablePM#, ...
pandas se fusionan en el tema de la columna de fecha
Estoy tratando de fusionar dos marcos de datos en la columna de fecha (probé ambos como tipoobject odatetime.date, pero no puede proporcionar la salida de fusión deseada: import pandas as pd df1 = pd.DataFrame({'amt': {0: 1549367.9496070854, ...
Manupilando datos del mes anterior según el mes actual
Tengo un nombre de tabla Prv_Data que contiene el mes anterior del informe, que tiene la columna Report_Id y Timeline. Prv_Data -> Report_ID | Timeline ---------------|-------------- 01 | Weekly @Mon 01 | Weekly @Mon 01 | Weekly @Mon 01 | Weekly ...
obtener los valores primero y último en el grupo - dplyr group_by con last () y first ()
El siguiente código debe agrupar los datos por año y luego crear dos nuevas columnas con el primer y el último valor de cada año. library(dplyr) set.seed(123) d <- data.frame( group = rep(1:3, each = 3), year = rep(seq(2000,2002,1),3), value = ...
Cómo eliminar grupos de observación con dplyr :: filter ()
Para los siguientes datos ds <- read.table(header = TRUE, text =" id year attend 1 2007 1 1 2008 1 1 2009 1 1 2010 1 1 2011 1 8 2007 3 8 2008 NA 8 2009 3 8 2010 NA 8 2011 3 9 2007 2 9 2008 3 9 2009 3 9 2010 5 9 2011 5 10 2007 4 10 2008 4 10 2009 ...
¿Cómo filtrar (con dplyr) todos los valores de un grupo si se alcanza el límite variable?
Aquí están los datos ficticios: cases <- rep(1:5,times=2) var1 <- as.numeric(c(450,100,250,999,200,500,980,10,700,1000)) var2 <- as.numeric(c(111,222,333,444,424,634,915,12,105,152)) maindata1 <- data.frame(cases,var1,var2) df1 <- maindata1 %>% ...
Asignar valor al grupo según la condición en la columna
Tengo un marco de datos similar al siguiente: > df = data.frame(group = c(1,1,1,2,2,2,3,3,3), date = c(1,2,3,4,5,6,7,8,9), value = c(3,4,3,4,5,6,6,4,9)) > df group date value 1 1 1 3 2 1 2 4 3 1 3 3 4 2 4 4 5 2 5 5 6 2 6 6 7 3 7 6 8 3 8 4 9 3 9 ...
Promedio del subgrupo de la segunda columna, agrupado por la primera columna
Supongamos que tengo la matriz A. La primera columna es "grupo". Entonces quiero calcular el promedio de la segunda columna para cada grupo. Entonces quiero crear B. A= 1 2 1 3 2 4 2 2 B= 1 2.5 2 3Lo mejor que hice hasta ahora es construir ...