Resultados da pesquisa a pedido "data.table"

2 a resposta

data.table: Como fazer a pesquisa binária de dois valores (numéricos) em uma chave: exemplo incluído

Os dados de exemplo: library(data.table) DT <- data.table(a = c(1, 3, 5, 9, 15), b = c("a", "c", "d", "e", "f"))Eu gostaria de obter duas linhas que éa == 3 | a == 9 , isso é # a b # 3 c # 9 eEu sei se eu faço:DT[, a:=as.character(a)] ...

2 a resposta

Verifique a frequência do valor data.table em outros data.table

library(data.table) DT1 <- data.table(num = 1:6, group = c("A", "B", "B", "B", "A", "C")) DT2 <- data.table(group = c("A", "B", "C"))Eu quero adicionar uma colunapopular paraDT2 com valorTRUE sempre queDT2$group está contido emDT1$group pelo ...

2 a resposta

Quantas chaves únicas meu data.table possui?

Dado umdata.table, como encontro o número de chaves exclusivas que ele contém? library(data.table) z <- data.table(id=c(1,2,1,3),key="id") length(unique(z$id)) ==> 3O problema é queunique équadrático em geral, mas como as chaves em umdata.table ...

2 a resposta

Encontre linhas duplicadas com o original

Eu posso obter linhas duplicadas emR com umdata.table dt usando dt[duplicated(dt, by=someColumns)]No entanto, gostaria de obter pares de linhas duplicadas e as "não duplicadas", por exemplo, consideredt: col1, col2, col3 A B C1 A B C2 A B1 ...

1 a resposta

usando eval em data.table

Estou tentando entender o comportamento de eval em um data.table como um "quadro". Com o seguinte data.table: set.seed(1) foo = data.table(var1=sample(1:3,1000,r=T), var2=rnorm(1000), var3=sample(letters[1:5],1000,replace = T))Estou tentando ...

5 a resposta

Dividindo a coluna de texto em várias novas colunas irregulares em uma tabela de dados em R

Eu tenho uma tabela de dados contendo mais de 20000 linhas e uma coluna. A cadeia de caracteres em cada coluna possui um número diferente de palavras. Quero dividir as palavras e colocar cada uma delas em uma nova coluna. Eu sei como posso fazer ...

3 a resposta

'Nul incorporado na cadeia' ao importar CSV grande (8 GB) com fread ()

Eu tenho um arquivo CSV grande (8,1 GB) que estou tentando integrar no R. Criei o CSV usando o csvkit do Pythonin2csv, convertido de um arquivo .txt, mas de alguma forma a conversão levou a caracteres nulos aparecendo no arquivo. Agora estou ...

2 a resposta

R (data.table) agrupa dados por intervalo personalizado (por exemplo, -18, 18-25,…, 65+)

Não consigo encontrar uma solução em R (usando data.table) para agrupar dados por um intervalo personalizado (por exemplo, -18, 18-25, ..., 65+) e não por um único valor. O que estou usando agora: DT[,list(M_Savings=mean(Savings), ...

1 a resposta

Crie uma nova coluna com base na condição existente em uma data de lançamento

Para tornar essa questão mais generalizada, acredito que também poderia ser reformulada como:Criando uma variável de fator sensível ao tempo em movimento. Embora seja um requisito incomum, isso pode ser utilizado para muitas fontes de dados ...

0 a resposta

segfault do estouro de pilha C em R usando data.table

Estou usando o pacote data.table no R para ler um grande quadro de dados (65046 linhas, 101959 colunas). O fread está trabalhando para mim em quadros de dados menores. Quando tento ler o quadro de dados de interesse, recebo o seguinte erro: dat ...