Resultados de la búsqueda a petición "data.table"

4 la respuesta

Filtrar tabla de datos por nombre de columna dinámica

Digamos que tengo una tabla de datos con las columnas A, B y C Me gustaría escribir una función que aplique un filtro (por ejemplo, A> 1) pero "A" debe ser dinámico (el parámetro de la función), de modo que si informo a A, lo hace A> 1; Si ...

4 la respuesta

Aplicar múltiples funciones a múltiples columnas en data.table

Estoy tratando de aplicar múltiples funciones a múltiples columnas de undata.table. Ejemplo: DT <- data.table("a"=1:5, "b"=2:6, "c"=3:7)Digamos que quiero obtener la media y la mediana de las columnas.a yb. Esto funciona: stats <- ...

2 la respuesta

Unión binaria condicional y actualización por referencia utilizando el paquete data.table

Así que aquí está mi problema de la vida real que siento que se puede resolver fácilmente y me falta algo obvio aquí. Tengo dos grandes conjuntos de datos llamadosTK yDFT library(data.table) set.seed(123) (TK <- data.table(venue_id = rep(1:3, ...

1 la respuesta

¿Cómo contar el número de veces que un elemento aparece consecutivamente en una tabla de datos?

Tengo un data.table que se ve así ID, Order, Segment 1, 1, A 1, 2, B 1, 3, B 1, 4, C 1, 5, B 1, 6, B 1, 7, B 1, 8, BBásicamente ordenando los datos usando la columna Ordenar. Me gustaría entender la cantidad de B consecutivas para cada una de ...

1 la respuesta

Acelerar un ejercicio de interpolación

Estoy ejecutando aproximadamente 45,000 regresiones lineales locales (esencialmente) en aproximadamente 1.2 millones de observaciones, por lo que agradecería un poco de ayuda tratando de acelerar las cosas porque soy impaciente. Básicamente ...

1 la respuesta

Cómo reestructurar de manera más eficiente una cadena de caracteres para fasttime en data.table

Tengo un data.table con caracteres en dos columnas así: 01/01/2014 | 00:30 02/01/2014 | 01:00 03/01/2014 | 01:30 etcLa longitud de este conjunto de datos varía, pero supera fácilmente las 300.000 filas cada vez que se ejecuta el script. ...

4 la respuesta

¿Cómo fusionar dos data.table por diferentes nombres de columna?

Tengo dos data.tableXyY. columnas enX: area, id, value columnas enY: ID, price, sales Cree las dos tablas de datos: X = data.table(area=c('US', 'UK', 'EU'), id=c('c001', 'c002', 'c003'), value=c(100, 200, 300) ) Y = data.table(ID=c('c001', ...

1 la respuesta

Acceder al objeto por dirección / puntero

¿Puedo acceder al objeto data.table creado en la sesión R actual por su dirección de memoria o puntero? library(data.table) DT <- data.table(a = 1:10, b = letters[1:10]) address(DT) # [1] "0x6bf9b90" attr(DT,".internal.selfref",TRUE) # <pointer: ...

1 la respuesta

¿Por qué es más rápido evaluar en `j` que con` $ `en un` data.table`?

Quizás esto ya haya sido respondido y me lo haya perdido, pero es difícil de buscar. Una pregunta muy simple: ¿Por qué esdt[,x] generalmente un poquito más rápido quedt$x? Ejemplo: dt<-data.table(id=1:1e7,var=rnorm(1e6)) ...

2 la respuesta

Lectura rápida y combinación con datos. Fread y Rbindlist de Table

Estoy buscando una manera de leer y fusionar rápidamente un montón de archivos de datos usando las funciones fread y rbindlist de data.table. Creo que si Fread podría tomar un vector de nombres de archivos como argumento, podría ser una línea ...