Resultados de la búsqueda a petición "data.table"
Dividir valores de diferentes longitudes y enlazar a columnas
Tengo un conjunto de datos bastante grande (alrededor de 100k observaciones), similar a esto: data <- data.frame( ID = seq(1, 5, 1), Values = c("1,2,3", "4", " ", "4,1,6,5,1,1,6", "0,0"), stringsAsFactors=F) data ID Values 1 1 1,2,3 2 2 4 3 3 4 ...
Medios más eficientes de crear un corpus y DTM con 4M filas
Mi archivo tiene más de 4 millones de filas y necesito una forma más eficiente de convertir mis datos en un corpus y una matriz de términos de documentos para poder pasarlos a un clasificador bayesiano. Considere el siguiente ...
Agregue nuevas columnas a una tabla de datos que contenga muchas variables
Quiero agregar muchas columnas nuevas simultáneamente a undata.table basado en cálculos por grupo. Un ejemplo de trabajo de mis datos se vería así: Time Stock x1 x2 x3 1: 2014-08-22 A 15 27 34 2: 2014-08-23 A 39 44 29 3: 2014-08-24 A 20 50 5 4: ...
¿Cómo crear una variable de rango bajo ciertas condiciones?
Mis datos contienen la variable de tiempo y la variable de marca elegida de la siguiente manera. el tiempo indica el tiempo de compra y la marca elegida indica la marca comprada en ese momento. Con estos datos, me gustaría crear una variable de ...
Comparar con la siguiente fila, agrupada, data.table
Tengo un marco de datos que contiene el número de visitas a la página por usuario, por semana. Quiero determinar, para cada usuario, si sus vistas aumentaron, disminuyeron o se mantuvieron igual después de un determinado evento. Mis datos se ven ...
Equilibrar (crear el mismo número de filas para cada individuo) de datos
Dado un data.table de la siguiente manera,id1 es una identificación de nivel de materia,id2 es una identificación de medida repetida dentro del sujeto,X son variables de datos de las cuales hay muchas. Quiero equilibrar los datos de manera que ...
data.table: función anónima en j
Estoy tratando de que una función anónima devuelva varias columnas en elj argumento de undata.table. Aquí hay un ejemplo: ## sample data tmpdt <- data.table(a = c(rep("a", 5), rep("b", 5)), b = c(rep("f", 3), rep("r", 7)), c = 1:10, d = 21:30) ...
contando valores después y antes del cambio de valor, dentro de los grupos, generando nuevas variables para cada turno único
Estoy buscando una forma de, dentro deid grupos, cuentan eventos únicos de cambios de valor enTF en los datos de datostbl. Quiero contar tanto hacia adelante como hacia atrás desdeTF cambios entre1 y0 oo y1. El conteo se debe almacenar en una ...
¿Por qué es: = permitido como operador infijo?
Me he encontrado con el populardata.table paquete y una cosa en particular me intrigó. Tiene un operador de asignación en el lugar : = Esto no está definido en la base R. De hecho, si no cargó eldata.table paquete, habría provocado un error si ...
Operador == inconsistente en columnas lógicas en data.table
Por favor vea el siguiente ejemplo reproducible: library(data.table) set.seed(123) DT <- data.table(A=rep(0.3,10000)) DT[, B := runif(.N) < A] DT[B == T, .N] # [1] 3005 DT[, summary(B)] # Mode FALSE TRUE NA's # logical 6995 3005 0Todo se ve bien ...