Resultados da pesquisa a pedido "data.table"

3 a resposta

Removendo Várias Colunas do R data.table com o parâmetro para remover as colunas

Estou tentando manipular uma série de data.tables de maneiras semelhantes e gostaria de escrever uma função para fazer isso. Gostaria de passar um parâmetro contendo uma lista de colunas que teriam as operações executadas. Isso funciona bem ...

1 a resposta

Razão da velocidade do fread no pacote data.table em R

Estou impressionado com a velocidade dofread função emdata.table em arquivos de dados grandes, mas como ele consegue ler tão rápido? Quais são as diferenças básicas de implementação entrefread eread.csv?

3 a resposta

Sobreposição de junção com as posições inicial e final

Considere o seguintedata.tables. O primeiro define um conjunto de regiões com posições inicial e final para cada grupo 'x': library(data.table) d1 <- data.table(x = letters[1:5], start = c(1,5,19,30, 7), end = c(3,11,22,39,25)) setkey(d1, x, ...

3 a resposta

Maneira mais rápida de ler arquivos de largura fixa

Eu trabalho com muitos arquivos de largura fixa (ou seja, sem caracteres de separação) que preciso ler em R. Portanto, geralmente há uma definição da largura da coluna para analisar a string em variáveis. Eu posso usarread.fwf para ler os dados ...

1 a resposta

data.table não computa grupos de NA por

Esta pergunta tem uma resposta parcialaqui [https://stackoverflow.com/questions/47444012/skip-na-in-data-table-by]mas a pergunta é muito específica e não posso aplicá-la ao meu próprio problema. Gostaria de pular uma computação potencialmente ...

1 a resposta

Unindo tabelas com nomes de colunas idênticos (sem chave) em R data.table

Como você lida com colunas sem chave com nome idêntico ao ingressar no data.tables? Estou procurando uma solução paratable.field notação em SQL. Por exemplo, digamos que eu tenho uma tabela DT que é preenchida novamente com novos dados para a ...

2 a resposta

Mantenha a primeira linha por várias colunas em uma tabela de dados R

Gostaria de obter a primeira linha apenas de uma tabela data.t, agrupada por várias colunas. Isso é direto com uma única coluna, por exemplo: (dt <- data.table(x = c(1, 1, 1, 2), y = c(1, 1, 2, 2), z = c(1, 2, 1, 2))) # x y z # |1: 1 1 1 # |2: ...

1 a resposta

Erro ao mesclar quadros de dados usando o pacote "data.table"

O seguinte é umexemplo reproduzívelde uma situação que eu estou enfrentando e preso (é umacliente de teste Estou usando para avaliar várias abordagens para mesclando conjuntos de dadospara minha pesquisa de dissertação). testData ...

1 a resposta

data.table soltar linhas-chave e resumir

Estou procurando uma maneira elegante de iterar sobre a chave de data.table, soltar as linhas que possuem essa chave e fazer um resumo sobre as linhas restantes. Por exemplo: mydt <- data.table(cat=c("a","a","b","b","c","c","c"), vals = ...

2 a resposta

Dividir valores de comprimentos diferentes e vincular a colunas

Eu tenho um conjunto de dados bastante grande (cerca de 100 mil observações), semelhante a este: data <- data.frame( ID = seq(1, 5, 1), Values = c("1,2,3", "4", " ", "4,1,6,5,1,1,6", "0,0"), stringsAsFactors=F) data ID Values 1 1 1,2,3 2 2 4 3 ...