Resultados da pesquisa a pedido "data.table"

1 a resposta

data.table :: fread não gosta de valores ausentes na primeira coluna

Isso é um bug nodata.table::fread (versão 1.9.2) ou expectativa / erro incorretos do usuário? Considere este exemplo trivial em que tenho uma tabela de valores,TAB separados com valores possivelmente ausentes. Se os valores estiverem ausentes na ...

1 a resposta

A atualização direta (substituição) do quadro de dados esparsos é lenta e ineficiente

Estou tentando ler algumas centenas de milhares de arquivos JSON e, eventualmente, colocá-los em um objeto dplyr. Mas os arquivos JSON não são simples análises de valor-chave e exigem muito pré-processamento. O pré-processamento é codificado e é ...

5 a resposta

Extrair linha correspondente ao valor mínimo de uma variável por grupo

Desejo (1) agrupar dados por uma variável (State), (2) em cada grupo encontre a linha do valor mínimo de outra variável (Employees) e (3) extraem a linha inteira. (1) e (2) são fáceis de usar, e eu sinto que (3) deveria ser também, mas ...

1 a resposta

Exibir nomes de linhas em um objeto data.table

Referência: Ao tentar responderesta pergunta muito básica [https://stackoverflow.com/questions/24198629/how-to-create-summaries-of-subgroups-based-on-factors-in-r/24199211#24199211] , De repente percebi que não era capaz de exibirrownames em ...

3 a resposta

Como passar uma lista de colunas para data.table, onde algumas são predeterminadas

Passe vetores de caracteres e nomes de colunas paradata.table como uma lista de colunas?Eu quero poder produzir um subconjunto de colunas em R usando data.table de uma maneira que eu possa determinar algumas delas anteriormente e passar a lista ...

1 a resposta

passar variáveis e nomes para a função data.table

Eu tenho um relatório que precisa ser aplicado para nomes diferentes de data.tables [tanto j quanto por]. A única maneira de fazê-lo envolvendo os argumentos em umeval(substitute(value)) função. Isso torna o código menos legível. Eu nomeei o ...

5 a resposta

Soma rolante por outra variável em R

Quero obter a soma de 7 dias por ID. Suponha que meus dados sejam assim: data<-as.data.frame(matrix(NA,42,3)) data$V1<-seq(as.Date("2014-05-01"),as.Date("2014-09-01"),by=3) data$V2<-rep(1:6,7) data$V3<-rep(c(1,2),21) ...

1 a resposta

Por que setDT não tem efeito neste caso?

Considere o seguinte código library(data.table) # 1.9.2 x <- data.frame(letters[1:2]) setDT(x) class(x) ## [1] "data.table" "data.frame"Qual é o resultado esperado. Agora se eu correr x <- letters[1:2] setDT(data.frame(x)) class(x) ## [1] ...

3 a resposta

Verificando com eficiência o valor de outra linha em data.table

Nota:Essa é uma pergunta que eu postei originalmente no grupo de ajuda data.table. Matt Dowle pediu um exemplo mais detalhado e eu postei este, mas tive problemas com a formatação no email. Eu já sei como formatar no SO, então pensei em ...

1 a resposta

Compreendendo o aviso data.table inválido .selfref

Estou tentando descobrir o erro data.table 'invalid .selfref' que estou recebendo com o código abaixo. library(data.table) library(dplyr) DT <- data.table(aa=1:100, bb=rnorm(n=100), dd=gl(2,100)) DT <- DT %.% group_by(dd, aa) %.% ...