Resultados da pesquisa a pedido "data.table"
Aplique várias funções a várias colunas em data.table
Estou tentando aplicar várias funções a várias colunas de umdata.table. Exemplo: DT <- data.table("a"=1:5, "b"=2:6, "c"=3:7)Digamos que eu queira obter a média e a mediana das colunasa eb. Isso funciona: stats <- DT[,.(mean_a=mean(a), ...
Junção binária condicional e atualização por referência usando o pacote data.table
Então, aqui está o meu problema da vida real, que eu sinto que pode ser facilmente resolvido e estou perdendo algo óbvio aqui. Eu tenho dois grandes conjuntos de dados chamadosTK eDFT library(data.table) set.seed(123) (TK <- data.table(venue_id ...
Como reestruturar com mais eficiência uma cadeia de caracteres para acelerar o tempo em data.table
Eu tenho um data.table com caracteres em duas colunas da seguinte forma: 01/01/2014 | 00:30 02/01/2014 | 01:00 03/01/2014 | 01:30 etcO comprimento desse conjunto de dados varia, mas ultrapassa facilmente 300.000 linhas cada vez que o script é ...
Como mesclar dois data.table por diferentes nomes de colunas?
Eu tenho dois data.tableXeY. colunas emX: area, id, value colunas emY: ID, price, sales Crie os dois data.tables: X = data.table(area=c('US', 'UK', 'EU'), id=c('c001', 'c002', 'c003'), value=c(100, 200, 300) ) Y = data.table(ID=c('c001', ...
Acessar objeto por endereço / ponteiro
Posso acessar o objeto data.table criado na sessão R atual por seu endereço de memória ou ponteiro? library(data.table) DT <- data.table(a = 1:10, b = letters[1:10]) address(DT) # [1] "0x6bf9b90" attr(DT,".internal.selfref",TRUE) # <pointer: ...
Por que é mais rápido avaliar em `j` do que com` $ `em uma` data.table`?
Talvez isso já tenha sido respondido e eu perdi, mas é difícil pesquisar. Uma pergunta muito simples: por que édt[,x] geralmente um pouco mais rápido quedt$x? Exemplo: dt<-data.table(id=1:1e7,var=rnorm(1e6)) ...
Leitura e mesclagem rápidas com o Fread e Rbindlist do Data.Table
Estou procurando uma maneira de ler e mesclar rapidamente um monte de arquivos de dados usando as funções fread e rbindlist do data.table. Eu acho que se o pavor pudesse pegar um vetor de nomes de arquivos como argumento, poderia ser uma linha ...
A maneira mais rápida de filtrar o conteúdo de uma coluna da lista data.frame no R / Rcpp
Eu tenho um data.frame: df <- structure(list(id = 1:3, vars = list("a", c("a", "b", "c"), c("b", "c"))), .Names = c("id", "vars"), row.names = c(NA, -3L), class = "data.frame")com uma coluna da lista (cada uma com um vetor de caracteres): > ...
Usando gsub adicionando nova coluna em uma data.table
Desculpe por uma pergunta muito básica, a solução deve ser muito simples, mas não consigo encontrá-la. Tentando usar o gsub adicionando uma nova coluna em um data.table, recebi o aviso "o argumento 'substituição' tem comprimento> 1 e somente o ...
Selecione colunas de data.table com base em regex
Como posso selecionar colunas de uma tabela de dados com base em uma regex? Considere um exemplo simples da seguinte maneira: library(data.table) mydt <- data.table(foo=c(1,2), bar=c(2,3), baz=c(3,4))Existe uma maneira de usar colunas debar ebaz ...