Resultados da pesquisa a pedido "dplyr"
Criando um campo "outro"
No momento, tenho o seguinte data.frame, criado pororiginal.df %.% group_by(Category) %.% tally() %.% arrange(desc(n)). DF <- structure(list(Category = c("E", "K", "M", "L", "I", "A", "S", "G", "N", "Q"), n = c(163051, 127133, 106680, 64868, ...
linhas únicas no dplyr: número_da_fileira () de tbl_dt inconsistente para tbl_df
en bref: Eu estou querendo saber como obter linhas únicas de umdata.table em algum lugar ao longo de umdplyr fluxo de trabalho. Desde a v0.2 eu posso usarrow_number==1 (Vejo: Remova linhas duplicadas usando o ...
Colocando contagens de ocorrências de valor em linhas em novas variáveis, como fazer isso em R com dplyr?
Eu tenho um grande dataframe (df) que se parece com isso: structure(list(var1 = c(1, 2, 3, 4, 2, 3, 4, 3, 2), var2 = c(2, 3, 4, 1, 2, 1, 1, 1, 3), var3 = c(4, 4, 2, 3, 3, 1, 1, 1, 4), var4 = c(2, 2, 2, 2, 3, 2, 3, 4, 1), var5 = c(4, 4, 2, 3, 3, ...
Preenchimento mais rápido das células da matriz i, j
Quero pegar colunas de um data.frame / matrix e aplicar uma função entre cada célula ([i, j]) do quadro de dados em que iej são as seqüências ao longo das colunas do quadro de dados. Basicamente, quero preencher uma matriz de células individuais ...
A atualização direta (substituição) do quadro de dados esparsos é lenta e ineficiente
Estou tentando ler algumas centenas de milhares de arquivos JSON e, eventualmente, colocá-los em um objeto dplyr. Mas os arquivos JSON não são simples análises de valor-chave e exigem muito pré-processamento. O pré-processamento é codificado e é ...
função personalizada após agrupar data.fame
Dados os seguintes data.frame d <- rep(c("a", "b"), each=5) l <- rep(1:5, 2) v <- 1:10 df <- data.frame(d=d, l=l, v=v*v) df d l v 1 a 1 1 2 a 2 4 3 a 3 9 4 a 4 16 5 a 5 25 6 b 1 36 7 b 2 49 8 b 3 64 9 b 4 81 10 b 5 100Agora eu quero adicionar ...
Criando variável de estação por mês com dplyr em R
Eu tenho um conjunto de dados que tem uma variável chamada mês, que cada mês como um caractere. Existe uma maneira do dplyr combinar alguns meses para criar uma variável de estação? Eu tentei o seguinte, mas ocorreu um erro: data %>% ...
dplyr :: do () requer uma função nomeada?
O seguinte funciona bem: library(dplyr) m <- function(df) { mod <- lm(Sepal.Length ~ Sepal.Width, data = df) pred <- predict(mod,newdata = df["Sepal.Width"]) data.frame(df,pred) } iris %>% group_by(Species) %>% do(m(.))Eu pensei que isso ...
O pacote dplyr pode ser usado para mutação condicional?
O mutate pode ser usado quando a mutação é condicional (dependendo dos valores de certos valores da coluna)? Este exemplo ajuda a mostrar o que quero dizer. structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, ...
dplyr, do (), extraindo parâmetros do modelo sem perder a variável de agrupamento
Um exemplo ligeiramente alterado da ajuda do R para do (): by_cyl <- group_by(mtcars, cyl) models <- by_cyl %>% do(mod = lm(mpg ~ disp, data = .)) coefficients<-models %>% do(data.frame(coef = coef(.$mod)[[1]]))No quadro de dadoscoeficientes, ...