Resultados de la búsqueda a petición "dplyr"
¿Por qué la función de resumen devuelve el mismo valor cada vez que se usa con la mutación de dplyr?
Aquí hay un marco de datos que contiene una columna de ID de usuario: > head(df) uid 1 14070210 2 14080815 3 14091420En aras de la discusión, quiero crear una nueva columna que contenga la raíz cuadrada de la identificación del usuario, y otra ...
Dplyr unirse en by = (a = b), donde a y b son variables que contienen cadenas?
Estoy tratando de realizar una unión interna de dos tablas usando dplyr, y creo que estoy tropezando con reglas de evaluación no estándar. Cuando se usa el argumento by = ("a" = "b"), todo funciona como se espera cuando "a" y "b" son cadenas ...
dplyr left_join coincidente NA
Al unir data.frames a lo largo de una clave, y una clave tiene un valor faltante (NA), mi intuición fue que las filas con una clave NA no deberían coincidir en el segundo data.frame. Para mi sorpresa, si hay NA en ambos data.frames, dplyr los ...
Filas únicas, considerando dos columnas, en R, sin orden
A diferencia de las preguntas que he encontrado, quiero obtener el único de dos columnas sin orden. Tengo un df: df<-cbind(c("a","b","c","b"),c("b","d","e","a")) > df [,1] [,2] [1,] "a" "b" [2,] "b" "d" [3,] "c" "e" [4,] "b" "a"En este caso, la ...
¿Cómo combinar el resultado de lapply a un data.frame?
Digamos, tengo un vector y una función con un argumento que devuelve un data.frame. Quiero aplicar la función a cada elemento del vector y combinar los resultados en un gran marco de datos. Tengo el comando de trabajo a continuación con lapply y ...
¿Cómo puedo usar una columna para determinar dónde obtengo el valor de otra columna?
Estoy tratando de usar una columna para determinar qué columna usar como valor para otra columna Se parece a esto: X Y Z Target 1 a b c X 2 d e f Y 3 g h i ZY quiero algo que se vea así: X Y Z Target TargetValue 1 a b c X a 2 d e f Y e 3 g h i ...
Agregar una columna de recuento de grupos a un marco de datos PySpark
Vengo de R y eltidyverse [https://www.tidyverse.org/]a PySpark debido a su manejo superior de Spark, y estoy luchando por mapear ciertos conceptos de un contexto a otro. En particular, suponga que tengo un conjunto de datos como el siguiente x ...
grupo dplyr por colnames descritos como vector de cadenas
Estoy tratando de agrupar_por múltiples columnas en mi marco de datos y no puedo escribir cada nombre de columna en la función group_by, así que quiero llamar a los nombres de columna como un vector de esta manera: cols <- ...
Calcular el cambio porcentual en R usando dplyr
Quiero calcular el porcentaje deProfit porYEAR que es una tarea bastante simple pero de alguna manera estoy obteniendoNA. He revisado las mismas preguntas que hice antes, pero no puedo entender por qué reciboNA. Los datos son los siguientes: > ...
Cómo eliminar filas donde todas las columnas son cero usando la tubería dplyr
Tengo el siguiente marco de datos: dat <- structure(list(`A-XXX` = c(1.51653275922944, 0.077037240321129, 0), `fBM-XXX` = c(2.22875185527511, 0, 0), `P-XXX` = c(1.73356698481106, 0, 0), `vBM-XXX` = c(3.00397859609183, 0, 0)), .Names = c("A-XXX", ...