Resultados da pesquisa a pedido "data.table"
data.table: Como fazer a pesquisa binária de dois valores (numéricos) em uma chave: exemplo incluído
Os dados de exemplo: library(data.table) DT <- data.table(a = c(1, 3, 5, 9, 15), b = c("a", "c", "d", "e", "f"))Eu gostaria de obter duas linhas que éa == 3 | a == 9 , isso é # a b # 3 c # 9 eEu sei se eu faço:DT[, a:=as.character(a)] ...
Verifique a frequência do valor data.table em outros data.table
library(data.table) DT1 <- data.table(num = 1:6, group = c("A", "B", "B", "B", "A", "C")) DT2 <- data.table(group = c("A", "B", "C"))Eu quero adicionar uma colunapopular paraDT2 com valorTRUE sempre queDT2$group está contido emDT1$group pelo ...
Quantas chaves únicas meu data.table possui?
Dado umdata.table, como encontro o número de chaves exclusivas que ele contém? library(data.table) z <- data.table(id=c(1,2,1,3),key="id") length(unique(z$id)) ==> 3O problema é queunique équadrático em geral, mas como as chaves em umdata.table ...
Encontre linhas duplicadas com o original
Eu posso obter linhas duplicadas emR com umdata.table dt usando dt[duplicated(dt, by=someColumns)]No entanto, gostaria de obter pares de linhas duplicadas e as "não duplicadas", por exemplo, consideredt: col1, col2, col3 A B C1 A B C2 A B1 ...
usando eval em data.table
Estou tentando entender o comportamento de eval em um data.table como um "quadro". Com o seguinte data.table: set.seed(1) foo = data.table(var1=sample(1:3,1000,r=T), var2=rnorm(1000), var3=sample(letters[1:5],1000,replace = T))Estou tentando ...
Dividindo a coluna de texto em várias novas colunas irregulares em uma tabela de dados em R
Eu tenho uma tabela de dados contendo mais de 20000 linhas e uma coluna. A cadeia de caracteres em cada coluna possui um número diferente de palavras. Quero dividir as palavras e colocar cada uma delas em uma nova coluna. Eu sei como posso fazer ...
'Nul incorporado na cadeia' ao importar CSV grande (8 GB) com fread ()
Eu tenho um arquivo CSV grande (8,1 GB) que estou tentando integrar no R. Criei o CSV usando o csvkit do Pythonin2csv, convertido de um arquivo .txt, mas de alguma forma a conversão levou a caracteres nulos aparecendo no arquivo. Agora estou ...
R (data.table) agrupa dados por intervalo personalizado (por exemplo, -18, 18-25,…, 65+)
Não consigo encontrar uma solução em R (usando data.table) para agrupar dados por um intervalo personalizado (por exemplo, -18, 18-25, ..., 65+) e não por um único valor. O que estou usando agora: DT[,list(M_Savings=mean(Savings), ...
Crie uma nova coluna com base na condição existente em uma data de lançamento
Para tornar essa questão mais generalizada, acredito que também poderia ser reformulada como:Criando uma variável de fator sensível ao tempo em movimento. Embora seja um requisito incomum, isso pode ser utilizado para muitas fontes de dados ...
segfault do estouro de pilha C em R usando data.table
Estou usando o pacote data.table no R para ler um grande quadro de dados (65046 linhas, 101959 colunas). O fread está trabalhando para mim em quadros de dados menores. Quando tento ler o quadro de dados de interesse, recebo o seguinte erro: dat ...