Resultados de la búsqueda a petición "data.table"

3 la respuesta

¿Cómo vincular data.table sin aumentar el consumo de memoria?

Tengo pocas tablas de datos enormesdt_1, dt_2, ..., dt_N con los mismos cols. Quiero unirlos en un solodatatable. Si yo uso dt <- rbind(dt_1, dt_2, ..., dt_N)o dt <- rbindlist(list(dt_1, dt_2, ..., dt_N))entonces el uso de memoria ...

2 la respuesta

data.table - selecciona las primeras n filas dentro del grupo [duplicar]

Esta pregunta ya tiene una respuesta aquí: ¿Cómo extraer las primeras n filas por grupo? [/questions/16325641/how-to-extract-the-first-n-rows-per-group] 2 respuestasTan simple como es, no sé undata.table solución para seleccionar las primeras ...

1 la respuesta

¿Los factores se almacenan de manera más eficiente en data.table que en caracteres?

Pensé que había leído en alguna parte (no recuerdo dónde) que los factores no eran realmente más eficientes que los vectores de caracteres en data.table. ¿Es esto cierto? Estaba debatiendo si seguir usando factores para almacenar varios vectores ...

2 la respuesta

Eliminar columnas de trama de datos según las condiciones en R

Tengo que eliminar columnas en mi marco de datos que tiene más de 4000 columnas y 180 filas. Las condiciones que quiero establecer para eliminar la columna en el marco de datos son: (i) Eliminar la columna si hay menos de dos valores / entradas ...

1 la respuesta

R: rendimiento de data.table vs merge (agregate ())

O para ser más general, esDT[,.SD[...],by=...] versusmerge(aggregate(...)). Sin más preámbulos, aquí hay datos y ejemplo: set.seed(5141) size = 1e6 df <- data.table(a = rnorm(size), b = paste0(sample(letters, size, T), sample(letters, size, T), ...

2 la respuesta

R: data.table count! NA por fila

Estoy tratando de contar el número de columnas que no contienen NA para cada fila y colocar ese valor en una nueva columna para esa fila. Datos de ejemplo: library(data.table) a = c(1,2,3,4,NA) b = c(6,NA,8,9,10) c = c(11,12,NA,14,15) d = ...

2 la respuesta

¿Cómo seleccionar filas de una tabla de datos para aplicar en otra tabla de datos?

Tengo dos tablas de datos.df (21 filas MIO) ytmp (500k filas) df tiene tres columnas que unen una patente original (origpat) con una patente de referencia (refpat), y vincular una clasificación original (mainprim) alorigpat. Debajo se muestran ...

3 la respuesta

Indice valores únicos en data.table

No estoy seguro de cómo formular la pregunta en palabras, pero ¿cómo puedo crear una columna de índice para una tabla de datos que aumente por grupo cuando aparezca un valor diferente? Aquí está el MWE library(data.table) in.data <- ...

2 la respuesta

fread EOF en lugar de separador

Estoy tratando de leer un archivo enorme con fread, pero supongo que algo está mal con el diseño del archivo. Si trato de leer el archivo con data = fread(input = "../data.txt", sep = "\t")en este archivo (acabo de tomar la línea con el error y ...

1 la respuesta

combinando cola con by en data.table

¿Cuál es la mejor manera de obtener la fila de cola de un data.table por un factor? Digamos que tengo: > dt <- data.table(category = c("A", "A", "B", "B", "B"), value = c(1,2,3,4,5)) > dt category value 1: A 1 2: A 2 3: B 3 4: B 4 5: B 5Quiero ...