Resultados da pesquisa a pedido "data.table"
Lista mais eficiente para o método data.fram
@ conversou com colegas de trabalho sobre isso e pensamos que valeria a pena ver o que as pessoas da região SO tinham a dizer. Suponha que eu tenha uma lista com N elementos, onde cada elemento tenha um vetor de comprimento X. Agora, suponha que ...
aneira mais rápida de subconjunto - data.table vs. MySQL
Eu sou um usuário R e frequentemente acho que preciso escrever funções que exijam subconjunto de grandes conjuntos de dados (10s de milhões de linhas). Quando aplico essas funções em um grande número de observações, pode demorar muito tempo se ...
Usando datas com o pacote data.table
Descobri recentemente o pacote data.table e agora me perguntava se deveria substituir parte do meu código plyr. Para resumir, eu realmente gosto do plyr e basicamente consegui tudo o que queria. No entanto, meu código demora um pouco e a ...
A maneira mais rápida de substituir NAs em um grande data.table
Eu tenho um grandeTabela de dado [http://cran.r-project.org/web/packages/data.table/index.html], com muitos valores ausentes espalhados por suas ~ 200 mil linhas e 200 colunas. Gostaria de re-codificar esses valores de NA para zeros da maneira ...
Extrair linhas exclusivas de uma tabela de dados em R [duplicado]
Esta pergunta já tem uma resposta aqui: Filtrando linhas duplicadas / não exclusivas em data.table [/questions/11792527/filtering-out-duplicated-non-unique-rows-in-data-table] 3 respostas Estou migrando de quadros e matrizes de dados para ...
Como é possível agregar e resumir dados rapidament
Tenho um conjunto de dados cujos cabeçalhos são assim: PID Time Site Rep Count Quero somar oCount porRep para cadaPID x Time x Site combo no data.frame resultante, quero obter o valor médio deCount paraPID x Time x Site combo. A função atual ...
ubstituindo NAs com o valor mais recente que não seja NA
Em um data.frame (ou data.table), gostaria de "avançar" NAs com o valor anterior não NA mais próximo. Um exemplo simples, usando vetores (em vez de umdata.frame) é o seguinte: > y <- c(NA, 2, 2, NA, NA, 3, NA, 4, NA, NA) Gostaria de uma ...
Por que está executando “único” mais rapidamente em um quadro de dados do que em uma matriz no
Comecei a acreditar que os quadros de dados não têm vantagens sobre as matrizes, exceto por conveniência notacional. No entanto, notei essa estranheza ao executarunique em matrizes e quadros de dados: parece correr mais rápido em um quadro de ...
Converter classes de coluna em data.table
Estou com um problema ao usar o data.table: Como converter classes de colunas? Aqui está um exemplo simples: com data.frame, não tenho problemas para convertê-lo, com data.table, simplesmente não sei como: df <- data.frame(ID=c(rep("A", 5), ...
perações eficientes em linha em uma data.table
Preciso encontrar o mínimo de linhas (+60) relativamente grandedata.frame (~ 250.000 x 3) (ou posso trabalhar de forma equivalente em umxts). set.seed(1000) my.df <- sample(1:5, 250000*3, replace=TRUE) dim(my.df) <- c(250000,3) my.df <- ...