Resultados da pesquisa a pedido "data.table"
não junta-se a data.tables
Eu tenho uma pergunta nodata.table idioma para "non-joins", inspirado no Iterator'squestã [https://stackoverflow.com/q/7822138/986817]. Aqui está um exemplo library(data.table) dt1 <- data.table(A1=letters[1:10], ...
Dividir uma tabela de dados com o by-operator: funções que retornam valores numéricos e / ou NAs falham
Eu tenho umdata.table com duas colunas: umaID coluna e umavalue coluna. Quero dividir a mesa peloID coluna e execute uma funçãofoo novalue coluna. Isso funciona bem desde quefoo não retorna NAs. Nesse caso, recebo um erro que me diz que os tipos ...
Grupo por várias colunas e soma outras colunas múltiplas
Tenho um quadro de dados com cerca de 200 colunas. Dessas, quero agrupar a tabela pelas 10 primeiras, mais ou menos, que são fatores e soma o restante das coluna Tenho uma lista de todos os nomes de colunas que desejo agrupar e a lista de todas ...
Percorra as colunas em uma tabela data.t e transforme essas colunas
Tenho uma data.tableDT com uma coluna chamadaRF e muitas colunas com sublinhado_iniciar. Eu quero percorrer todas essas colunas com um sublinhado e subtrair oRF coluna a partir dele. No entanto, eu estou preso. Parece que tudo no RHS do:=perador ...
Estou usando plyr certo? Parece que estou usando muita memória
Tenho o seguinte conjunto de dados um tanto grande: > dim(dset) [1] 422105 25 > class(dset) [1] "data.frame" >Sem fazer nada, o processo R parece levar cerca de 1 GB de RAM. Estou tentando executar o seguinte código: dset <- ddply(dset, ...
Como seleciono linhas por dois critérios em data.table em R
Digamos que eu possua uma tabela de dados e desejo selecionar todas as linhas em que a variável x tem o valor de b. Isso é fáci library(data.table) DT <- data.table(x=rep(c("a","b","c"),each=3), y=c(1,3,6), v=1:9) setkey(DT,x) # set a 1-column ...
Por que os pandas foram mesclados em python mais rapidamente do que os mesclados data.table no R em 201
Vi recentemente o pandas [http://pandas.sourceforge.net/] biblioteca para python, que de acordo comesta referência [http://wesmckinney.com/blog/some-pandas-database-join-merge-benchmarks-vs-r-basemerge/] realiza mesclagens muito rápidas na ...
Como você exclui uma coluna pelo nome em data.table?
Para se livrar de uma coluna chamada "foo" em umdata.frame, Eu posso fazer df <- df[-grep('foo', colnames(df))] No entanto, uma vezdf é convertido emdata.table objeto, não há como simplesmente remover uma colun Exemplo df <- data.frame(id = ...
Agregando subtotais e totais totais com data.table
Eu tenho umadata.table em R library(data.table) set.seed(1) DT = data.table( group=sample(letters[1:2],100,replace=TRUE), year=sample(2010:2012,100,replace=TRUE), v=runif(100)) A agregação desses dados em uma tabela de resumo por grupo e ano é ...
R: Calcular as médias do subconjunto de um grupo
Eu quero calcular a média para cada "Dia", mas para uma parte do dia (Hora = 12-14). Esse código funciona para mim, mas eu tenho que inserir todos os dias como uma nova linha de código, o que equivale a centenas de linha Parece que deve ser ...