Resultados da pesquisa a pedido "data.table"
Subconfigurando uma tabela de dados por intervalo, usando a pesquisa binária
Como você define um subconjunto de uma tabela de dados por um intervalo numérico, com a intenção de usar a pesquisa binária? Por exemplo: require(data.table) set.seed(1) x<-runif(10000000,min=0,max=10) y<-runif(10000000,min=0,max=10) ...
Meta-programação Data.table
Eu acho que meta-programação é o termo certo aqui.Eu quero ser capaz de usar data.table muito como se usaria o MySQL em dizer um webapp. Ou seja, os usuários...
Unindo o resultado de duas tabelas estatísticas em uma tabela em R
Em continuação desta ediçãoTeste de comparação de Mann-Whitney entre os grupos [https://stackoverflow.com/questions/51494868/comparison-mann-whitney-test-between-groups] , Decidi criar um novo tópico. A solução de Rui Barradas me ajudou a ...
Nomes de colunas dinâmicas em data.table
Eu estou tentando adicionar colunas ao meu
data.table: Como fazer a pesquisa binária de dois valores (numéricos) em uma chave: exemplo incluído
Os dados de exemplo: library(data.table) DT <- data.table(a = c(1, 3, 5, 9, 15), b = c("a", "c", "d", "e", "f"))Eu gostaria de obter duas linhas que éa == 3 | a == 9 , isso é # a b # 3 c # 9 eEu sei se eu faço:DT[, a:=as.character(a)] ...
Como é possível agregar e resumir dados rapidament
Tenho um conjunto de dados cujos cabeçalhos são assim: PID Time Site Rep Count Quero somar oCount porRep para cadaPID x Time x Site combo no data.frame resultante, quero obter o valor médio deCount paraPID x Time x Site combo. A função atual ...
Criando uma partição de dados usando circunflexo e data.table
Eu tenho um data.table em R que eu quero usar com pacote de interpolação set.seed(42) trainingRows<-createDataPartition(DT$variable, p=0.75, list=FALSE) head(trainingRows) # view the samples of row numbersNo entanto, não consigo selecionar as ...
A maneira mais rápida de substituir NAs em um grande data.table
Eu tenho um grandeTabela de dado [http://cran.r-project.org/web/packages/data.table/index.html], com muitos valores ausentes espalhados por suas ~ 200 mil linhas e 200 colunas. Gostaria de re-codificar esses valores de NA para zeros da maneira ...
da tabela de dados, selecione aleatoriamente uma linha por grupo
Estou procurando uma maneira eficiente de selecionar linhas de uma tabela de dados para que eu tenha uma linha representativa para cada valor exclusivo em uma coluna específica. Deixe-me propor um exemplo simples: require(data.table) y = ...