Resultados de la búsqueda a petición "data-manipulation"

1 la respuesta

pandas reset_index después de groupby.value_counts ()

Estoy tratando de agrupar por una columna y calcular el recuento de valores en otra columna. import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2], 'Amt':[20,20,20,30,30,30,30,40, 40,10, 10, 40,40,40]}) ...

2 la respuesta

Cómo usar la función de aplicación de pandas en todas las columnas de algunas filas del marco de datos

tengo undataframe. Quiero reemplazar los valores de todas las columnas de algunas filas a un valor predeterminado. ¿Hay alguna manera de hacer esto a través depandas apply función Aquí está el marco de datos import pandas as ...

2 la respuesta

contando después y antes del cambio de valor, dentro de los grupos, generando nuevas variables para cada turno único

Estoy trabajando para contar las ocurrencias de valores únicos dentro de mis grupos,id. Estoy mirandoTF. CuandoTF cambios Quiero contar tanto hacia adelante como hacia atrás desde ese punto. Este conteo debe almacenarse en una nueva variablePM#, ...

1 la respuesta

pandas se fusionan en el tema de la columna de fecha

Estoy tratando de fusionar dos marcos de datos en la columna de fecha (probé ambos como tipoobject odatetime.date, pero no puede proporcionar la salida de fusión deseada: import pandas as pd df1 = pd.DataFrame({'amt': {0: 1549367.9496070854, ...

1 la respuesta

Manupilando datos del mes anterior según el mes actual

Tengo un nombre de tabla Prv_Data que contiene el mes anterior del informe, que tiene la columna Report_Id y Timeline. Prv_Data -> Report_ID | Timeline ---------------|-------------- 01 | Weekly @Mon 01 | Weekly @Mon 01 | Weekly @Mon 01 | Weekly ...

1 la respuesta

obtener los valores primero y último en el grupo - dplyr group_by con last () y first ()

El siguiente código debe agrupar los datos por año y luego crear dos nuevas columnas con el primer y el último valor de cada año. library(dplyr) set.seed(123) d <- data.frame( group = rep(1:3, each = 3), year = rep(seq(2000,2002,1),3), value = ...

2 la respuesta

Cómo eliminar grupos de observación con dplyr :: filter ()

Para los siguientes datos ds <- read.table(header = TRUE, text =" id year attend 1 2007 1 1 2008 1 1 2009 1 1 2010 1 1 2011 1 8 2007 3 8 2008 NA 8 2009 3 8 2010 NA 8 2011 3 9 2007 2 9 2008 3 9 2009 3 9 2010 5 9 2011 5 10 2007 4 10 2008 4 10 2009 ...

1 la respuesta

¿Cómo filtrar (con dplyr) todos los valores de un grupo si se alcanza el límite variable?

Aquí están los datos ficticios: cases <- rep(1:5,times=2) var1 <- as.numeric(c(450,100,250,999,200,500,980,10,700,1000)) var2 <- as.numeric(c(111,222,333,444,424,634,915,12,105,152)) maindata1 <- data.frame(cases,var1,var2) df1 <- maindata1 %>% ...

3 la respuesta

Asignar valor al grupo según la condición en la columna

Tengo un marco de datos similar al siguiente: > df = data.frame(group = c(1,1,1,2,2,2,3,3,3), date = c(1,2,3,4,5,6,7,8,9), value = c(3,4,3,4,5,6,6,4,9)) > df group date value 1 1 1 3 2 1 2 4 3 1 3 3 4 2 4 4 5 2 5 5 6 2 6 6 7 3 7 6 8 3 8 4 9 3 9 ...

1 la respuesta

Promedio del subgrupo de la segunda columna, agrupado por la primera columna

Supongamos que tengo la matriz A. La primera columna es "grupo". Entonces quiero calcular el promedio de la segunda columna para cada grupo. Entonces quiero crear B. A= 1 2 1 3 2 4 2 2 B= 1 2.5 2 3Lo mejor que hice hasta ahora es construir ...