Resultados da pesquisa a pedido "dplyr"

2 a resposta

Adicionando uma coluna de contagem de grupos a um quadro de dados PySpark

Eu estou vindo de R e oarrumado [https://www.tidyverse.org/]ao PySpark devido ao seu manuseio superior do Spark, e estou lutando para mapear certos conceitos de um contexto para outro. Em particular, suponha que eu tivesse um conjunto de dados ...

1 a resposta

Sparklyr: como centralizar uma tabela Spark com base na coluna?

Eu tenho uma tabela Spark: simx x0: num 1.00 2.00 3.00 ... x1: num 2.00 3.00 4.00 ... ... x788: num 2.00 3.00 4.00 ...e um identificador chamadosimX_tbl no ambiente R que está conectado a estesimx mesa. Eu quero fazer uma centralização para ...

3 a resposta

Preenchendo datas ausentes em uma série temporal agrupada - de maneira organizada?

Dado um data.frame que contém uma série temporal e um ou minério de campos de agrupamento. Portanto, temos várias séries temporais - uma para cada combinação de agrupamento. Mas algumas datas estão faltando. Então, qual é a maneira mais fácil (em ...

1 a resposta

Como separar uma coluna no dplyr com base no regex

Eu tenho o seguinte quadro de dados: df <- structure(list(X2 = c("BB_137.HVMSC", "BB_138.combined.HVMSC", "BB_139.combined.HVMSC", "BB_140.combined.HVMSC", "BB_141.HVMSC", "BB_142.combined.HMSC-bm")), .Names = "X2", row.names = c(NA, -6L), class ...

1 a resposta

Impedir que o dplyr entre nos NA

Eu gostaria de fazer uma junção completa de 2 df's. Para minha surpresa, o comportamento padrão do dplyr é associar-se aos NAs, se existirem nos dois DFs. Existe uma funcionalidade para impedir que o dplyr faça isso? Aqui está um exemplo com ...

4 a resposta

Como atualizar valores em um pipe dplyr?

Eu quero atualizar valores em uma nova coluna. Aqui estão os meus dados: people<- c("father", "parents", "father", "children", "girl", "boy", "grand father", "grand mother", "grandparents" ) dataset0 <- data.frame(people) dataset0E a ...

1 a resposta

R: níveis de fator de reabastecimento para várias parcelas individuais

Estou tentando criar vários gráficos individuais a partir do mesmo data.frame com uma ordem diferente dos níveis de fator no eixo y para cada gráfico. Cada gráfico deve ordenar os níveis de fator em y decrescentemente. Sei que isso pode ser ...

1 a resposta

Reordenar eixo x do gráfico de barras ggplot por facet_wrap

Digamos que eu tenho um exemplo de quadro de dados: frame <- data.frame(group = c(rep(1, 3), rep(2, 3)), idea = c(1, 2, 3, 1, 2, 4), value = c(10000, 5000, 50, 5000, 7500, 100), level = sample(c("rough", "detailed"), 6, TRUE))Eu gostaria de um ...

1 a resposta

dplyr com nome de colunas em uma função

Não é possível descobrir como usar nomes de colunas em uma função usandodplyr R pacote. Exemplo reproduzível está abaixo: Dados set.seed(12345) Y <- rnorm(10) Env <- paste0("E", rep(1:2, each = 5)) Gen <- paste0("G", rep(1:5, times = 2)) df1 <- ...

1 a resposta

Executando um dplyr full_join sem uma variável comum para misturar quadros de dados

Usando o dplyrfull_join() estou tentando executar o equivalente a uma operação básicamerge() operação na qual não existem variáveis comuns (incapaz de satisfazer o argumento "by ="). Isso combinará dois quadros de dados e retornará todas as ...