Resultados da pesquisa a pedido "data.table"

4 a resposta

Meios mais eficientes de criar um corpus e DTM com 4 milhões de linhas

Meu arquivo tem mais de 4 milhões de linhas e preciso de uma maneira mais eficiente de converter meus dados em uma matriz de termos de corpus e documento, para que eu possa passá-los para um classificador bayesiano. Considere o seguinte ...

4 a resposta

Qual é a alternativa de alto desempenho aos loops de forfetização de dados por ID de grupo?

Um paradigma de análise recorrente que encontro em minha pesquisa é a necessidade de subconjunto com base em todos os diferentes valores de identificação de grupo, realizando análises estatísticas em cada grupo e colocando os resultados em uma ...

4 a resposta

Adicione novas colunas a uma tabela de dados contendo muitas variáveis

Quero adicionar muitas novas colunas simultaneamente a umdata.table com base em cálculos por grupos. Um exemplo de trabalho dos meus dados seria algo como isto: Time Stock x1 x2 x3 1: 2014-08-22 A 15 27 34 2: 2014-08-23 A 39 44 29 3: 2014-08-24 ...

2 a resposta

Compare com a próxima linha, agrupada, data.table

Eu tenho um quadro de dados contendo o número de visualizações de página por usuário, por semana. Quero determinar, para cada usuário, se suas visualizações aumentaram, diminuíram ou permaneceram iguais após um determinado evento. Meus dados são ...

2 a resposta

data.table: função anônima em j

Estou tentando fazer com que uma função anônima retorne várias colunas noj argumento de umdata.table. Aqui está um exemplo: ## sample data tmpdt <- data.table(a = c(rep("a", 5), rep("b", 5)), b = c(rep("f", 3), rep("r", 7)), c = 1:10, d = 21:30) ...

1 a resposta

Localizando sobreposições entre conjuntos de intervalos / junções de sobreposição eficiente

Visão global:Eu preciso juntar duas tabelas: ref contém os intervalos de tempo (det1 parat2) junto com umid para cada intervalo e umspace onde esse intervalo ocorre. map contém intervalos de tempo (t1 parat2) cada um com um resultadores e ...

2 a resposta

Balanceamento (criando o mesmo número de linhas para cada indivíduo)

Dada uma tabela de dados da seguinte maneira,id1 é um ID no nível do assunto,id2 é um ID de medida repetida dentro do sujeito,X são variáveis de dados das quais existem muitas. Quero equilibrar os dados de modo que cada indivíduo tenha o mesmo ...

1 a resposta

Preencha os valores ausentes por grupo em data.table

Se alguém quiser preencher os valores ausentes de uma variável com base na observação anterior / posterior não NA dentro de um grupo, o comando data.table será setkey(DT,id,date) DT[, value_filled_in := DT[!is.na(value), list(id, ...

2 a resposta

Operador == inconsistente nas colunas lógicas em data.table

Por favor, veja o seguinte exemplo reproduzível: library(data.table) set.seed(123) DT <- data.table(A=rep(0.3,10000)) DT[, B := runif(.N) < A] DT[B == T, .N] # [1] 3005 DT[, summary(B)] # Mode FALSE TRUE NA's # logical 6995 3005 0Tudo parece bem ...

2 a resposta

Por que: = é permitido como operador de infix?

Me deparei com o populardata.table pacote e uma coisa em particular me intrigou. Possui um operador de atribuição no local : = Isso não está definido na base R. De fato, se você não carregou odata.table pacote, teria gerado um erro se você ...