Resultados de la búsqueda a petición "data.table"
Crear una nueva columna r data.table basada en valores en otra columna y agrupar
tengo undata.table con fecha, código postal y cantidades de compra. library(data.table) set.seed(88) DT <- data.table(date = Sys.Date()-365 + sort(sample(1:100, 10)), zip = sample(c("2000", "1150", "3000"),10, replace = TRUE), purchaseAmount = ...
Aún luchando con el manejo de grandes conjuntos de datos
He estado leyendo en este sitio web y no he podido encontrar la respuesta exacta. Si ya existe, pido disculpas por la nueva publicación. Estoy trabajando con conjuntos de datos que son extremadamente grandes (600 millones de filas, 64 columnas ...
Cumsum con reset cuando se encuentra 0 y por grupos
A continuación se muestra mi marco de datos, me gustaría obtener la columna "sí". Parece que no puedo obtener elcumsum para restablecer cuando llega al 0 en función del campo "valor" por "id". Hay otras preguntas como esta, pero las soluciones no ...
Contar filas desde que se cumple una condición de fecha
Tengo un R data.table con las siguientes columnas Date Time X Y 5/9/2016 12:00:00 AM 30 125 5/9/2016 12:30:00 AM 27 127 5/9/2016 1:00:00 AM 30 133 5/9/2016 1:30:00 AM 25 115 5/9/2016 2:00:00 AM 26 116 5/9/2016 3:00:00 AM 34 128 5/9/2016 3:30:00 ...
R data.table filas duplicadas con un par de columnas
data.table es muy útil, pero no pude encontrar una manera elegante de resolver el siguiente problema. Hay algunas respuestas más cercanas, pero ninguna resolvió mi problema. Digamos que el siguiente es el objeto data.table y quiero filtrar filas ...
¿Cómo agregar un índice por conjunto de datos cuando se usa rbindlist?
Tengo varios archivos csv diferentes con la misma estructura. Los leí en R usando fread, y luego los uní en un conjunto de datos más grande usandorbindlist(). files <- list.files( pattern = "*.csv" ); x2csv <- rbindlist( lapply(files, fread, ...
Calcular la relación de Levenshtein de cada elemento de una tabla de datos con cada valor de una tabla de referencia y fusionar con la relación máxima
Tengo un data.table dt con 3 columnas: carné de identidadnombre como cadenaumbral como numUna muestra es: dt <- <- data.table(nid = c("n1","n2", "n3", "n4"), rname = c("apple", "pear", "banana", "kiwi"), maxr = c(0.5, 0.8, 0.7, 0.6)) nid | ...
R fuzzy string match para devolver una columna específica basada en una cadena coincidente
Tengo dos grandes conjuntos de datos, uno alrededor de medio millón de registros y el otro alrededor de 70K. Estos conjuntos de datos tienen dirección. Quiero coincidir si alguna de las direcciones en el conjunto de datos más pequeño ...
Cómo encontrar una secuencia monótona junto con tener en cuenta el reinicio de secuencia al alcanzar el máximo
Tengo un data.table say dt name <- c("a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v") score <- c(42, 82, 43, 32,47,48, 49, 50, 54, 59, 76, 09, 13, 88, 91, 99, 04, 06, 08, 12, 14, 15) ...
Encontrar una secuencia monótona junto con tomar la secuencia de reinicio al alcanzar el máximo en cuenta
Tengo un data.table say dt name <- letters[1:22] score <- c(42, 82, 43, 32, 47, 48, 49, 50, 54, 59, 76, 9, 13, 88, 91, 99, 4, 6, 8, 12, 14, 15) class <- rep(c('c1', 'c2', 'c3'), c(7, 3, 12)) dt <- data.table(name, score, class)parece que: > dt ...