Resultados da pesquisa a pedido "data.table"

2 a resposta

Remova colunas do quadro de dados com base nas condições em R

Eu tenho que remover colunas no meu dataframe que tem mais de 4000 colunas e 180 linhas. As condições que eu quero definir para remover a coluna no dataframe são: (i) Remova a coluna se houver menos de dois valores / entradas nesse coluna (ii) ...

1 a resposta

R: desempenho data.table vs mesclagem (agregado ())

Ou para ser mais geral, éDT[,.SD[...],by=...] versusmerge(aggregate(...)). Sem mais delongas, aqui estão dados e exemplo: set.seed(5141) size = 1e6 df <- data.table(a = rnorm(size), b = paste0(sample(letters, size, T), sample(letters, size, T), ...

2 a resposta

Como selecionar linhas de uma data.table para aplicar em outra data.table?

Eu tenho dois data.tablesdf (21 linhas MIO) etmp (500 mil linhas) df possui três colunas vinculando uma patente original (origpat) com uma patente de referência (refpat) e vincular uma classificação original (mainprim) aoorigpat. Abaixo das 30 ...

2 a resposta

R: contagem de data.table! NA por linha

Estou tentando contar o número de colunas que não contêm NA para cada linha e colocar esse valor em uma nova coluna para essa linha. Dados de exemplo: library(data.table) a = c(1,2,3,4,NA) b = c(6,NA,8,9,10) c = c(11,12,NA,14,15) d = ...

3 a resposta

Indexar valores exclusivos em data.table

Não tenho certeza de como formular a pergunta em palavras, mas como posso criar uma coluna de índice para uma tabela de dados que por grupo é incrementada quando um valor diferente é exibido? Aqui está o MWE library(data.table) in.data <- ...

2 a resposta

teme o EOF em vez do separador

Estou tentando ler um arquivo enorme com medo, mas acho que algo está errado com o layout do arquivo. Se eu tentar ler o arquivo com data = fread(input = "../data.txt", sep = "\t")neste arquivo (eu apenas peguei a linha com o erro e alguns ...

3 a resposta

Vetorize data.table like, grepl ou similar para comparação de strings de big data

Preciso verificar se uma string em uma coluna contém um valor (numérico) correspondente da mesma linha de outra coluna, para todas as linhas. Se eu estivesse apenas verificando a string em busca de um único padrão, isso seria simples usando ...

1 a resposta

combinando cauda com por em data.table

Qual é a melhor maneira de obter a linha final de uma tabela de dados por um fator? Diga que tenho: > dt <- data.table(category = c("A", "A", "B", "B", "B"), value = c(1,2,3,4,5)) > dt category value 1: A 1 2: A 2 3: B 3 4: B 4 5: B 5Quero ...

1 a resposta

Agrupando uma tabela de dados executando intervalos

Estou usando R com o pacote data.table e gostaria de agrupar uma data.table executando intervalos (de tempo) ou caixas sobrepostas. Para cada um desses intervalos de execução, eu gostaria de encontrar a ocorrência de pares iguais de dados. Além ...

3 a resposta

Maneira mais rápida de ler em 100.000 arquivos .dat.gz

Eu tenho algumas centenas de milhares muito pequenas.dat.gz arquivos que desejo ler no R da maneira mais eficiente possível. Eu leio o arquivo e, em seguida, agrego e descarto os dados imediatamente, portanto não me preocupo com o gerenciamento ...