Resultados de la búsqueda a petición "data.table"
Filtrar tabla de datos por nombre de columna dinámica
Digamos que tengo una tabla de datos con las columnas A, B y C Me gustaría escribir una función que aplique un filtro (por ejemplo, A> 1) pero "A" debe ser dinámico (el parámetro de la función), de modo que si informo a A, lo hace A> 1; Si ...
Aplicar múltiples funciones a múltiples columnas en data.table
Estoy tratando de aplicar múltiples funciones a múltiples columnas de undata.table. Ejemplo: DT <- data.table("a"=1:5, "b"=2:6, "c"=3:7)Digamos que quiero obtener la media y la mediana de las columnas.a yb. Esto funciona: stats <- ...
Unión binaria condicional y actualización por referencia utilizando el paquete data.table
Así que aquí está mi problema de la vida real que siento que se puede resolver fácilmente y me falta algo obvio aquí. Tengo dos grandes conjuntos de datos llamadosTK yDFT library(data.table) set.seed(123) (TK <- data.table(venue_id = rep(1:3, ...
¿Cómo contar el número de veces que un elemento aparece consecutivamente en una tabla de datos?
Tengo un data.table que se ve así ID, Order, Segment 1, 1, A 1, 2, B 1, 3, B 1, 4, C 1, 5, B 1, 6, B 1, 7, B 1, 8, BBásicamente ordenando los datos usando la columna Ordenar. Me gustaría entender la cantidad de B consecutivas para cada una de ...
Acelerar un ejercicio de interpolación
Estoy ejecutando aproximadamente 45,000 regresiones lineales locales (esencialmente) en aproximadamente 1.2 millones de observaciones, por lo que agradecería un poco de ayuda tratando de acelerar las cosas porque soy impaciente. Básicamente ...
Cómo reestructurar de manera más eficiente una cadena de caracteres para fasttime en data.table
Tengo un data.table con caracteres en dos columnas así: 01/01/2014 | 00:30 02/01/2014 | 01:00 03/01/2014 | 01:30 etcLa longitud de este conjunto de datos varía, pero supera fácilmente las 300.000 filas cada vez que se ejecuta el script. ...
¿Cómo fusionar dos data.table por diferentes nombres de columna?
Tengo dos data.tableXyY. columnas enX: area, id, value columnas enY: ID, price, sales Cree las dos tablas de datos: X = data.table(area=c('US', 'UK', 'EU'), id=c('c001', 'c002', 'c003'), value=c(100, 200, 300) ) Y = data.table(ID=c('c001', ...
Acceder al objeto por dirección / puntero
¿Puedo acceder al objeto data.table creado en la sesión R actual por su dirección de memoria o puntero? library(data.table) DT <- data.table(a = 1:10, b = letters[1:10]) address(DT) # [1] "0x6bf9b90" attr(DT,".internal.selfref",TRUE) # <pointer: ...
¿Por qué es más rápido evaluar en `j` que con` $ `en un` data.table`?
Quizás esto ya haya sido respondido y me lo haya perdido, pero es difícil de buscar. Una pregunta muy simple: ¿Por qué esdt[,x] generalmente un poquito más rápido quedt$x? Ejemplo: dt<-data.table(id=1:1e7,var=rnorm(1e6)) ...
Lectura rápida y combinación con datos. Fread y Rbindlist de Table
Estoy buscando una manera de leer y fusionar rápidamente un montón de archivos de datos usando las funciones fread y rbindlist de data.table. Creo que si Fread podría tomar un vector de nombres de archivos como argumento, podría ser una línea ...