Resultados da pesquisa a pedido "data.table"
Meios mais eficientes de criar um corpus e DTM com 4 milhões de linhas
Meu arquivo tem mais de 4 milhões de linhas e preciso de uma maneira mais eficiente de converter meus dados em uma matriz de termos de corpus e documento, para que eu possa passá-los para um classificador bayesiano. Considere o seguinte ...
Qual é a alternativa de alto desempenho aos loops de forfetização de dados por ID de grupo?
Um paradigma de análise recorrente que encontro em minha pesquisa é a necessidade de subconjunto com base em todos os diferentes valores de identificação de grupo, realizando análises estatísticas em cada grupo e colocando os resultados em uma ...
Adicione novas colunas a uma tabela de dados contendo muitas variáveis
Quero adicionar muitas novas colunas simultaneamente a umdata.table com base em cálculos por grupos. Um exemplo de trabalho dos meus dados seria algo como isto: Time Stock x1 x2 x3 1: 2014-08-22 A 15 27 34 2: 2014-08-23 A 39 44 29 3: 2014-08-24 ...
Compare com a próxima linha, agrupada, data.table
Eu tenho um quadro de dados contendo o número de visualizações de página por usuário, por semana. Quero determinar, para cada usuário, se suas visualizações aumentaram, diminuíram ou permaneceram iguais após um determinado evento. Meus dados são ...
data.table: função anônima em j
Estou tentando fazer com que uma função anônima retorne várias colunas noj argumento de umdata.table. Aqui está um exemplo: ## sample data tmpdt <- data.table(a = c(rep("a", 5), rep("b", 5)), b = c(rep("f", 3), rep("r", 7)), c = 1:10, d = 21:30) ...
Localizando sobreposições entre conjuntos de intervalos / junções de sobreposição eficiente
Visão global:Eu preciso juntar duas tabelas: ref contém os intervalos de tempo (det1 parat2) junto com umid para cada intervalo e umspace onde esse intervalo ocorre. map contém intervalos de tempo (t1 parat2) cada um com um resultadores e ...
Balanceamento (criando o mesmo número de linhas para cada indivíduo)
Dada uma tabela de dados da seguinte maneira,id1 é um ID no nível do assunto,id2 é um ID de medida repetida dentro do sujeito,X são variáveis de dados das quais existem muitas. Quero equilibrar os dados de modo que cada indivíduo tenha o mesmo ...
Preencha os valores ausentes por grupo em data.table
Se alguém quiser preencher os valores ausentes de uma variável com base na observação anterior / posterior não NA dentro de um grupo, o comando data.table será setkey(DT,id,date) DT[, value_filled_in := DT[!is.na(value), list(id, ...
Operador == inconsistente nas colunas lógicas em data.table
Por favor, veja o seguinte exemplo reproduzível: library(data.table) set.seed(123) DT <- data.table(A=rep(0.3,10000)) DT[, B := runif(.N) < A] DT[B == T, .N] # [1] 3005 DT[, summary(B)] # Mode FALSE TRUE NA's # logical 6995 3005 0Tudo parece bem ...
Por que: = é permitido como operador de infix?
Me deparei com o populardata.table pacote e uma coisa em particular me intrigou. Possui um operador de atribuição no local : = Isso não está definido na base R. De fato, se você não carregou odata.table pacote, teria gerado um erro se você ...