Resultados de la búsqueda a petición "data.table"

2 la respuesta

Dividir valores de diferentes longitudes y enlazar a columnas

Tengo un conjunto de datos bastante grande (alrededor de 100k observaciones), similar a esto: data <- data.frame( ID = seq(1, 5, 1), Values = c("1,2,3", "4", " ", "4,1,6,5,1,1,6", "0,0"), stringsAsFactors=F) data ID Values 1 1 1,2,3 2 2 4 3 3 4 ...

4 la respuesta

Medios más eficientes de crear un corpus y DTM con 4M filas

Mi archivo tiene más de 4 millones de filas y necesito una forma más eficiente de convertir mis datos en un corpus y una matriz de términos de documentos para poder pasarlos a un clasificador bayesiano. Considere el siguiente ...

4 la respuesta

Agregue nuevas columnas a una tabla de datos que contenga muchas variables

Quiero agregar muchas columnas nuevas simultáneamente a undata.table basado en cálculos por grupo. Un ejemplo de trabajo de mis datos se vería así: Time Stock x1 x2 x3 1: 2014-08-22 A 15 27 34 2: 2014-08-23 A 39 44 29 3: 2014-08-24 A 20 50 5 4: ...

2 la respuesta

¿Cómo crear una variable de rango bajo ciertas condiciones?

Mis datos contienen la variable de tiempo y la variable de marca elegida de la siguiente manera. el tiempo indica el tiempo de compra y la marca elegida indica la marca comprada en ese momento. Con estos datos, me gustaría crear una variable de ...

2 la respuesta

Comparar con la siguiente fila, agrupada, data.table

Tengo un marco de datos que contiene el número de visitas a la página por usuario, por semana. Quiero determinar, para cada usuario, si sus vistas aumentaron, disminuyeron o se mantuvieron igual después de un determinado evento. Mis datos se ven ...

2 la respuesta

Equilibrar (crear el mismo número de filas para cada individuo) de datos

Dado un data.table de la siguiente manera,id1 es una identificación de nivel de materia,id2 es una identificación de medida repetida dentro del sujeto,X son variables de datos de las cuales hay muchas. Quiero equilibrar los datos de manera que ...

2 la respuesta

data.table: función anónima en j

Estoy tratando de que una función anónima devuelva varias columnas en elj argumento de undata.table. Aquí hay un ejemplo: ## sample data tmpdt <- data.table(a = c(rep("a", 5), rep("b", 5)), b = c(rep("f", 3), rep("r", 7)), c = 1:10, d = 21:30) ...

2 la respuesta

contando valores después y antes del cambio de valor, dentro de los grupos, generando nuevas variables para cada turno único

Estoy buscando una forma de, dentro deid grupos, cuentan eventos únicos de cambios de valor enTF en los datos de datostbl. Quiero contar tanto hacia adelante como hacia atrás desdeTF cambios entre1 y0 oo y1. El conteo se debe almacenar en una ...

2 la respuesta

¿Por qué es: = permitido como operador infijo?

Me he encontrado con el populardata.table paquete y una cosa en particular me intrigó. Tiene un operador de asignación en el lugar : = Esto no está definido en la base R. De hecho, si no cargó eldata.table paquete, habría provocado un error si ...

2 la respuesta

Operador == inconsistente en columnas lógicas en data.table

Por favor vea el siguiente ejemplo reproducible: library(data.table) set.seed(123) DT <- data.table(A=rep(0.3,10000)) DT[, B := runif(.N) < A] DT[B == T, .N] # [1] 3005 DT[, summary(B)] # Mode FALSE TRUE NA's # logical 6995 3005 0Todo se ve bien ...