Resultados da pesquisa a pedido "data.table"

Meu arquivo tem mais de 4 milhões de linhas e preciso de uma maneira mais eficiente de converter meus dados em uma matriz de termos de corpus e documento, para que eu possa passá-los para um classificador bayesiano. Considere o seguinte ...

r performance loops subset

4 a resposta

Qual é a alternativa de alto desempenho aos loops de forfetização de dados por ID de grupo?

Um paradigma de análise recorrente que encontro em minha pesquisa é a necessidade de subconjunto com base em todos os diferentes valores de identificação de grupo, realizando análises estatísticas em cada grupo e colocando os resultados em uma ...

4 a resposta

Adicione novas colunas a uma tabela de dados contendo muitas variáveis

Quero adicionar muitas novas colunas simultaneamente a umdata.table com base em cálculos por grupos. Um exemplo de trabalho dos meus dados seria algo como isto: Time Stock x1 x2 x3 1: 2014-08-22 A 15 27 34 2: 2014-08-23 A 39 44 29 3: 2014-08-24 ...

join merge r

2 a resposta

Compare com a próxima linha, agrupada, data.table

Eu tenho um quadro de dados contendo o número de visualizações de página por usuário, por semana. Quero determinar, para cada usuário, se suas visualizações aumentaram, diminuíram ou permaneceram iguais após um determinado evento. Meus dados são ...

2 a resposta

data.table: função anônima em j

Estou tentando fazer com que uma função anônima retorne várias colunas noj argumento de umdata.table. Aqui está um exemplo: ## sample data tmpdt <- data.table(a = c(rep("a", 5), rep("b", 5)), b = c(rep("f", 3), rep("r", 7)), c = 1:10, d = 21:30) ...

r dplyr

1 a resposta

Localizando sobreposições entre conjuntos de intervalos / junções de sobreposição eficiente

Visão global:Eu preciso juntar duas tabelas: ref contém os intervalos de tempo (det1 parat2) junto com umid para cada intervalo e umspace onde esse intervalo ocorre. map contém intervalos de tempo (t1 parat2) cada um com um resultadores e ...

r reshape2

2 a resposta

Balanceamento (criando o mesmo número de linhas para cada indivíduo)

Dada uma tabela de dados da seguinte maneira,id1 é um ID no nível do assunto,id2 é um ID de medida repetida dentro do sujeito,X são variáveis de dados das quais existem muitas. Quero equilibrar os dados de modo que cada indivíduo tenha o mesmo ...

1 a resposta

Preencha os valores ausentes por grupo em data.table

Se alguém quiser preencher os valores ausentes de uma variável com base na observação anterior / posterior não NA dentro de um grupo, o comando data.table será setkey(DT,id,date) DT[, value_filled_in := DT[!is.na(value), list(id, ...

2 a resposta

Operador == inconsistente nas colunas lógicas em data.table

Por favor, veja o seguinte exemplo reproduzível: library(data.table) set.seed(123) DT <- data.table(A=rep(0.3,10000)) DT[, B := runif(.N) < A] DT[B == T, .N] # [1] 3005 DT[, summary(B)] # Mode FALSE TRUE NA's # logical 6995 3005 0Tudo parece bem ...

r colon-equals

2 a resposta

Por que: = é permitido como operador de infix?

Me deparei com o populardata.table pacote e uma coisa em particular me intrigou. Possui um operador de atribuição no local : = Isso não está definido na base R. De fato, se você não carregou odata.table pacote, teria gerado um erro se você ...

Página 29 do 46

27 282930 31

Resultados da pesquisa a pedido "data.table"

Meios mais eficientes de criar um corpus e DTM com 4 milhões de linhas

Qual é a alternativa de alto desempenho aos loops de forfetização de dados por ID de grupo?

Adicione novas colunas a uma tabela de dados contendo muitas variáveis

Tags populares

Compare com a próxima linha, agrupada, data.table

data.table: função anônima em j

Localizando sobreposições entre conjuntos de intervalos / junções de sobreposição eficiente

Balanceamento (criando o mesmo número de linhas para cada indivíduo)

Preencha os valores ausentes por grupo em data.table

Operador == inconsistente nas colunas lógicas em data.table

Por que: = é permitido como operador de infix?

Você é muito ativo! É ótimo!

Resultados da pesquisa a pedido "data.table"

Tags populares