Resultados da pesquisa a pedido "data.table"

3 a resposta

não junta-se a data.tables

Eu tenho uma pergunta nodata.table idioma para "non-joins", inspirado no Iterator'squestã [https://stackoverflow.com/q/7822138/986817]. Aqui está um exemplo library(data.table) dt1 <- data.table(A1=letters[1:10], ...

1 a resposta

Dividir uma tabela de dados com o by-operator: funções que retornam valores numéricos e / ou NAs falham

Eu tenho umdata.table com duas colunas: umaID coluna e umavalue coluna. Quero dividir a mesa peloID coluna e execute uma funçãofoo novalue coluna. Isso funciona bem desde quefoo não retorna NAs. Nesse caso, recebo um erro que me diz que os tipos ...

6 a resposta

Grupo por várias colunas e soma outras colunas múltiplas

Tenho um quadro de dados com cerca de 200 colunas. Dessas, quero agrupar a tabela pelas 10 primeiras, mais ou menos, que são fatores e soma o restante das coluna Tenho uma lista de todos os nomes de colunas que desejo agrupar e a lista de todas ...

3 a resposta

Percorra as colunas em uma tabela data.t e transforme essas colunas

Tenho uma data.tableDT com uma coluna chamadaRF e muitas colunas com sublinhado_iniciar. Eu quero percorrer todas essas colunas com um sublinhado e subtrair oRF coluna a partir dele. No entanto, eu estou preso. Parece que tudo no RHS do:=perador ...

4 a resposta

Estou usando plyr certo? Parece que estou usando muita memória

Tenho o seguinte conjunto de dados um tanto grande: > dim(dset) [1] 422105 25 > class(dset) [1] "data.frame" >Sem fazer nada, o processo R parece levar cerca de 1 GB de RAM. Estou tentando executar o seguinte código: dset <- ddply(dset, ...

2 a resposta

Como seleciono linhas por dois critérios em data.table em R

Digamos que eu possua uma tabela de dados e desejo selecionar todas as linhas em que a variável x tem o valor de b. Isso é fáci library(data.table) DT <- data.table(x=rep(c("a","b","c"),each=3), y=c(1,3,6), v=1:9) setkey(DT,x) # set a 1-column ...

6 a resposta

Por que os pandas foram mesclados em python mais rapidamente do que os mesclados data.table no R em 201

Vi recentemente o pandas [http://pandas.sourceforge.net/] biblioteca para python, que de acordo comesta referência [http://wesmckinney.com/blog/some-pandas-database-join-merge-benchmarks-vs-r-basemerge/] realiza mesclagens muito rápidas na ...

16 a resposta

Como você exclui uma coluna pelo nome em data.table?

Para se livrar de uma coluna chamada "foo" em umdata.frame, Eu posso fazer df <- df[-grep('foo', colnames(df))] No entanto, uma vezdf é convertido emdata.table objeto, não há como simplesmente remover uma colun Exemplo df <- data.frame(id = ...

10 a resposta

Agregando subtotais e totais totais com data.table

Eu tenho umadata.table em R library(data.table) set.seed(1) DT = data.table( group=sample(letters[1:2],100,replace=TRUE), year=sample(2010:2012,100,replace=TRUE), v=runif(100)) A agregação desses dados em uma tabela de resumo por grupo e ano é ...

6 a resposta

R: Calcular as médias do subconjunto de um grupo

Eu quero calcular a média para cada "Dia", mas para uma parte do dia (Hora = 12-14). Esse código funciona para mim, mas eu tenho que inserir todos os dias como uma nova linha de código, o que equivale a centenas de linha Parece que deve ser ...