Resultados da pesquisa a pedido "data.table"
Remova colunas do quadro de dados com base nas condições em R
Eu tenho que remover colunas no meu dataframe que tem mais de 4000 colunas e 180 linhas. As condições que eu quero definir para remover a coluna no dataframe são: (i) Remova a coluna se houver menos de dois valores / entradas nesse coluna (ii) ...
R: desempenho data.table vs mesclagem (agregado ())
Ou para ser mais geral, éDT[,.SD[...],by=...] versusmerge(aggregate(...)). Sem mais delongas, aqui estão dados e exemplo: set.seed(5141) size = 1e6 df <- data.table(a = rnorm(size), b = paste0(sample(letters, size, T), sample(letters, size, T), ...
Como selecionar linhas de uma data.table para aplicar em outra data.table?
Eu tenho dois data.tablesdf (21 linhas MIO) etmp (500 mil linhas) df possui três colunas vinculando uma patente original (origpat) com uma patente de referência (refpat) e vincular uma classificação original (mainprim) aoorigpat. Abaixo das 30 ...
R: contagem de data.table! NA por linha
Estou tentando contar o número de colunas que não contêm NA para cada linha e colocar esse valor em uma nova coluna para essa linha. Dados de exemplo: library(data.table) a = c(1,2,3,4,NA) b = c(6,NA,8,9,10) c = c(11,12,NA,14,15) d = ...
Indexar valores exclusivos em data.table
Não tenho certeza de como formular a pergunta em palavras, mas como posso criar uma coluna de índice para uma tabela de dados que por grupo é incrementada quando um valor diferente é exibido? Aqui está o MWE library(data.table) in.data <- ...
teme o EOF em vez do separador
Estou tentando ler um arquivo enorme com medo, mas acho que algo está errado com o layout do arquivo. Se eu tentar ler o arquivo com data = fread(input = "../data.txt", sep = "\t")neste arquivo (eu apenas peguei a linha com o erro e alguns ...
Vetorize data.table like, grepl ou similar para comparação de strings de big data
Preciso verificar se uma string em uma coluna contém um valor (numérico) correspondente da mesma linha de outra coluna, para todas as linhas. Se eu estivesse apenas verificando a string em busca de um único padrão, isso seria simples usando ...
combinando cauda com por em data.table
Qual é a melhor maneira de obter a linha final de uma tabela de dados por um fator? Diga que tenho: > dt <- data.table(category = c("A", "A", "B", "B", "B"), value = c(1,2,3,4,5)) > dt category value 1: A 1 2: A 2 3: B 3 4: B 4 5: B 5Quero ...
Agrupando uma tabela de dados executando intervalos
Estou usando R com o pacote data.table e gostaria de agrupar uma data.table executando intervalos (de tempo) ou caixas sobrepostas. Para cada um desses intervalos de execução, eu gostaria de encontrar a ocorrência de pares iguais de dados. Além ...
Maneira mais rápida de ler em 100.000 arquivos .dat.gz
Eu tenho algumas centenas de milhares muito pequenas.dat.gz arquivos que desejo ler no R da maneira mais eficiente possível. Eu leio o arquivo e, em seguida, agrego e descarto os dados imediatamente, portanto não me preocupo com o gerenciamento ...