Resultados de la búsqueda a petición "data.table"

2 la respuesta

Crear una nueva columna r data.table basada en valores en otra columna y agrupar

tengo undata.table con fecha, código postal y cantidades de compra. library(data.table) set.seed(88) DT <- data.table(date = Sys.Date()-365 + sort(sample(1:100, 10)), zip = sample(c("2000", "1150", "3000"),10, replace = TRUE), purchaseAmount = ...

2 la respuesta

Aún luchando con el manejo de grandes conjuntos de datos

He estado leyendo en este sitio web y no he podido encontrar la respuesta exacta. Si ya existe, pido disculpas por la nueva publicación. Estoy trabajando con conjuntos de datos que son extremadamente grandes (600 millones de filas, 64 columnas ...

2 la respuesta

Cumsum con reset cuando se encuentra 0 y por grupos

A continuación se muestra mi marco de datos, me gustaría obtener la columna "sí". Parece que no puedo obtener elcumsum para restablecer cuando llega al 0 en función del campo "valor" por "id". Hay otras preguntas como esta, pero las soluciones no ...

2 la respuesta

Contar filas desde que se cumple una condición de fecha

Tengo un R data.table con las siguientes columnas Date Time X Y 5/9/2016 12:00:00 AM 30 125 5/9/2016 12:30:00 AM 27 127 5/9/2016 1:00:00 AM 30 133 5/9/2016 1:30:00 AM 25 115 5/9/2016 2:00:00 AM 26 116 5/9/2016 3:00:00 AM 34 128 5/9/2016 3:30:00 ...

1 la respuesta

R data.table filas duplicadas con un par de columnas

data.table es muy útil, pero no pude encontrar una manera elegante de resolver el siguiente problema. Hay algunas respuestas más cercanas, pero ninguna resolvió mi problema. Digamos que el siguiente es el objeto data.table y quiero filtrar filas ...

2 la respuesta

¿Cómo agregar un índice por conjunto de datos cuando se usa rbindlist?

Tengo varios archivos csv diferentes con la misma estructura. Los leí en R usando fread, y luego los uní en un conjunto de datos más grande usandorbindlist(). files <- list.files( pattern = "*.csv" ); x2csv <- rbindlist( lapply(files, fread, ...

1 la respuesta

Calcular la relación de Levenshtein de cada elemento de una tabla de datos con cada valor de una tabla de referencia y fusionar con la relación máxima

Tengo un data.table dt con 3 columnas: carné de identidadnombre como cadenaumbral como numUna muestra es: dt <- <- data.table(nid = c("n1","n2", "n3", "n4"), rname = c("apple", "pear", "banana", "kiwi"), maxr = c(0.5, 0.8, 0.7, 0.6)) nid | ...

2 la respuesta

R fuzzy string match para devolver una columna específica basada en una cadena coincidente

Tengo dos grandes conjuntos de datos, uno alrededor de medio millón de registros y el otro alrededor de 70K. Estos conjuntos de datos tienen dirección. Quiero coincidir si alguna de las direcciones en el conjunto de datos más pequeño ...

1 la respuesta

Cómo encontrar una secuencia monótona junto con tener en cuenta el reinicio de secuencia al alcanzar el máximo

Tengo un data.table say dt name <- c("a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v") score <- c(42, 82, 43, 32,47,48, 49, 50, 54, 59, 76, 09, 13, 88, 91, 99, 04, 06, 08, 12, 14, 15) ...

1 la respuesta

Encontrar una secuencia monótona junto con tomar la secuencia de reinicio al alcanzar el máximo en cuenta

Tengo un data.table say dt name <- letters[1:22] score <- c(42, 82, 43, 32, 47, 48, 49, 50, 54, 59, 76, 9, 13, 88, 91, 99, 4, 6, 8, 12, 14, 15) class <- rep(c('c1', 'c2', 'c3'), c(7, 3, 12)) dt <- data.table(name, score, class)parece que: > dt ...