Resultados de la búsqueda a petición "dplyr"

2 la respuesta

Mantenga solo grupos de datos con múltiples observaciones

Estoy intentando mantener solo deids con múltiples observaciones. Tengo el siguiente código help <- data.frame(deid = c(1, 5, 5, 5, 5, 5, 5, 12, 12, 12, 12), session.number = c(1, 1, 2, 3, 4, 5, 6, 1, 2, 3, 4), days.since.last = c(0, 0, 7, 14, ...

1 la respuesta

R dplyr, el uso de mutate con na.omit provoca un error de tamaño incompatible (% d)

Estoy haciendo limpieza de datos. Utilizo mucho mutate en Dplyr ya que genera nuevas columnas paso a paso y puedo ver fácilmente cómo funciona. Aquí hay dos ejemplos donde tengo este error Error: incompatible size (%d), expecting %d (the group ...

2 la respuesta

¿Cómo cambiar la codificación de conexión dplyr :: tbl a utf8?

En una base de datos MySQL, una tabla está codificada en utf8, pero por alguna razón la conexión está en latin1. res <- RMySQL::dbSendQuery(con,"show variables like 'character_set_%'") dbFetch(res) Variable_name Value 1 character_set_client ...

2 la respuesta

Agrupar y filtrar la gestión de datos mediante dplyr

Tome un conjunto de datos simple a <- c(1,2,3,4,5,6,7,8) b <- c(1,2,2,1,2,2,2,2) c <- c(1,1,1,2,2,2,3,3) d <- data.frame(a,b,c)ahora quiero filtrar mis datos, para que podamosgroup_by(c) y luego eliminar todos los datos donde nob=1ocurre. Así ...

6 la respuesta

dplyr resume con subtotales

Una de las mejores cosas de las tablas dinámicas en Excel es que proporcionan subtotales automáticamente. Primero, me gustaría saber si ya hay algo creado dentro de dplyr que pueda lograr esto. Si no, ¿cuál es la forma más fácil de lograrlo? En ...

2 la respuesta

¿Cómo puedo calcular el cambio porcentual dentro de un grupo para varias columnas en R?

Tengo un marco de datos con una columna de ID, una columna de fecha (12 meses para cada ID) y tengo 23 variables numéricas. Me gustaría obtener el cambio porcentual por mes dentro de cada ID. Estoy usando el paquete quantmod para obtener el ...

4 la respuesta

R: Seleccionar la primera de n filas consecutivas por encima de un cierto valor umbral

Tengo un marco de datos con MRN, fechas y un valor de prueba. Necesito seleccionar todos losprimerofilas por MRN que tienenTresvalores consecutivos superiores a 0,5. Esta es una versión de ejemplo de los datos: MRN Collected_Date ANC 1 001 ...

1 la respuesta

comportamiento diferente para group_by para data.table vs. data.frame

Cuando se utiliza dplyr :: mutate en un data.table agrupado, la agrupación se pierde posteriormente. Este comportamiento no ocurre para data.frame. ¿Es esto un error? Estoy usando dplyr_0.4.1 y data.table_1.9.4. require(data.table) ...

2 la respuesta

Calculando la diferencia entre filas consecutivas por grupo usando dplyr?

Tengo un marco de datos de identificadores y marcas de tiempo. Me gustaría calcular la diferencia entre cada marca de tiempo secuencial para una identificación individual. Mi dataframe se ve así: id time Alpha 1 Alpha 4 Alpha 7 Beta 5 Beta ...

5 la respuesta

Ejecute una función personalizada en un marco de datos en R, por grupo

Tener algunos problemas para obtener una función personalizada para recorrer un grupo en un marco de datos. Aquí hay algunos datos de muestra: set.seed(42) tm <- as.numeric(c("1", "2", "3", "3", "2", "1", "2", "3", "1", "1")) d <- ...