Resultados de la búsqueda a petición "dplyr"

1 la respuesta

¿Por qué la función de resumen devuelve el mismo valor cada vez que se usa con la mutación de dplyr?

Aquí hay un marco de datos que contiene una columna de ID de usuario: > head(df) uid 1 14070210 2 14080815 3 14091420En aras de la discusión, quiero crear una nueva columna que contenga la raíz cuadrada de la identificación del usuario, y otra ...

4 la respuesta

Dplyr unirse en by = (a = b), donde a y b son variables que contienen cadenas?

Estoy tratando de realizar una unión interna de dos tablas usando dplyr, y creo que estoy tropezando con reglas de evaluación no estándar. Cuando se usa el argumento by = ("a" = "b"), todo funciona como se espera cuando "a" y "b" son cadenas ...

2 la respuesta

dplyr left_join coincidente NA

Al unir data.frames a lo largo de una clave, y una clave tiene un valor faltante (NA), mi intuición fue que las filas con una clave NA no deberían coincidir en el segundo data.frame. Para mi sorpresa, si hay NA en ambos data.frames, dplyr los ...

4 la respuesta

Filas únicas, considerando dos columnas, en R, sin orden

A diferencia de las preguntas que he encontrado, quiero obtener el único de dos columnas sin orden. Tengo un df: df<-cbind(c("a","b","c","b"),c("b","d","e","a")) > df [,1] [,2] [1,] "a" "b" [2,] "b" "d" [3,] "c" "e" [4,] "b" "a"En este caso, la ...

2 la respuesta

¿Cómo combinar el resultado de lapply a un data.frame?

Digamos, tengo un vector y una función con un argumento que devuelve un data.frame. Quiero aplicar la función a cada elemento del vector y combinar los resultados en un gran marco de datos. Tengo el comando de trabajo a continuación con lapply y ...

3 la respuesta

¿Cómo puedo usar una columna para determinar dónde obtengo el valor de otra columna?

Estoy tratando de usar una columna para determinar qué columna usar como valor para otra columna Se parece a esto: X Y Z Target 1 a b c X 2 d e f Y 3 g h i ZY quiero algo que se vea así: X Y Z Target TargetValue 1 a b c X a 2 d e f Y e 3 g h i ...

2 la respuesta

Agregar una columna de recuento de grupos a un marco de datos PySpark

Vengo de R y eltidyverse [https://www.tidyverse.org/]a PySpark debido a su manejo superior de Spark, y estoy luchando por mapear ciertos conceptos de un contexto a otro. En particular, suponga que tengo un conjunto de datos como el siguiente x ...

1 la respuesta

grupo dplyr por colnames descritos como vector de cadenas

Estoy tratando de agrupar_por múltiples columnas en mi marco de datos y no puedo escribir cada nombre de columna en la función group_by, así que quiero llamar a los nombres de columna como un vector de esta manera: cols <- ...

2 la respuesta

Calcular el cambio porcentual en R usando dplyr

Quiero calcular el porcentaje deProfit porYEAR que es una tarea bastante simple pero de alguna manera estoy obteniendoNA. He revisado las mismas preguntas que hice antes, pero no puedo entender por qué reciboNA. Los datos son los siguientes: > ...

3 la respuesta

Cómo eliminar filas donde todas las columnas son cero usando la tubería dplyr

Tengo el siguiente marco de datos: dat <- structure(list(`A-XXX` = c(1.51653275922944, 0.077037240321129, 0), `fBM-XXX` = c(2.22875185527511, 0, 0), `P-XXX` = c(1.73356698481106, 0, 0), `vBM-XXX` = c(3.00397859609183, 0, 0)), .Names = c("A-XXX", ...