Resultados de la búsqueda a petición "data.table"
Bucle grepl () a través de data.table (R)
Tengo un conjunto de datos almacenado como data.tableDT que se parece a esto: print(DT) category industry 1: administration admin 2: nurse practitioner truck 3: trucking truck 4: administration admin 5: warehousing nurse 6: warehousing admin 7: ...
R - Cree una nueva variable donde cada observación dependa de otra tabla y otras variables en el marco de datos
Tengo las dos tablas siguientes: df <- data.frame(eth = c("A","B","B","A","C"),ZIP1 = c(1,1,2,3,5)) Inc <- data.frame(ZIP2 = c(1,2,3,4,5,6,7),A = c(56,98,43,4,90,19,59), B = c(49,10,69,30,10,4,95),C = c(69,2,59,8,17,84,30)) eth ZIP1 ZIP2 A B C A ...
de la tabla de datos, seleccione aleatoriamente una fila por grupo
Estoy buscando una manera eficiente de seleccionar filas de una tabla de datos de modo que tenga una fila representativa para cada valor único en una columna en particular. Permítanme proponer un ejemplo simple: require(data.table) y = ...
dplyr mutate / replace en un subconjunto de filas
Estoy en el proceso de probar un flujo de trabajo basado en dplyr (en lugar de usar principalmente data.table, a lo que estoy acostumbrado), y me he encontrado con un problema al que no puedo encontrar una solución dplyr equivalente. . Comúnmente ...
Convierta columnas de clase arbitraria a la clase de columnas coincidentes en otra tabla de datos.
Pregunta: Estoy trabajando en R. Quiero que las columnas compartidas de 2 data.tables (compartidas que significan el mismo nombre de columna) tengan clases coincidentes. Estoy luchando con una forma de convertir genéricamente un objeto de clase ...
Usando la función distm de geosfera en una tabla de datos para calcular distancias
He creado un data.table en que tiene 6 columnas. Mi data.table tiene columnas que comparan dos ubicaciones: Ubicación 1 y Ubicación 2. Estoy tratando de usar la función distm para calcular la distancia entre las ubicaciones en cada fila, creando ...
¿Cómo selecciono un subconjunto de filas después del grupo por una columna específica en la tabla de datos R [duplicado]
Esta pregunta ya tiene una respuesta aquí: Subconjunto de marco de datos basado en el número de filas por grupo [/questions/20204257/subset-data-frame-based-on-number-of-rows-per-group] 2 respuestasQuiero seleccionar un subconjunto de filas en ...
Método eficiente para contar casos abiertos al momento de la presentación de cada caso en un conjunto de datos grande
En un conjunto de datos grande (~ 1M casos), cada caso tiene un "creado" y un "censurado"dateTime. Quiero contar el número de otros casos que estaban abiertos en el momento en que se creó cada caso. Los casos están abiertos entre su "creado" y ...
Unir a la izquierda usando data.table
Supongamos que tengo dostabla de datos's: UNA: A B 1: 1 12 2: 2 13 3: 3 14 4: 4 15SI: A B 1: 2 13 2: 3 14y tengo el siguiente código: merge_test = merge(dataA, dataB, by="A", all.data=TRUE)Yo obtengo: A B.x B.y 1: 2 13 13 2: 3 14 14Sin ...
DataTable en R, formateando filas con una categoría de valor específica a un porcentaje
Si tengo una tabla de datos y mi objetivo es cambiar cualquier fila que contenga MES = "Cambio de porcentaje:" a porcentaje: MONTH YEAR Client Revenue Metric 1 Metric 2 Metric 3 1: MTD: 1 2015 Client A 255999.33000 5.251913e+07 3.476303e+07 ...