Resultados de la búsqueda a petición "dataframe"
Niveles de factor de unión de dos columnas
Tengo 2 columnas de datos con el mismo tipo de datos (cadenas). Quiero unir los niveles de las columnas. es decir. tenemos: col1 col2 Bob John Tom Bob Frank Jane Jim Bob Tom Bob ... ... (and so on)ahora col1 tiene 4 niveles (Bob, Tom Frank, ...
R: agrega una columna que cuenta secuencialmente dentro de los grupos pero que se repite para duplicados
Estoy buscando una solución para agregar la columna "deseado_resultado" preferiblemente usando dplyr y / o ave (). Vea el marco de datos aquí, donde el grupo es "sección" y las instancias únicas que quiero que mi columna "deseado_resultados" ...
Julia Dataframe agrupar por y funciones de tablas dinámicas
¿Cómo agrupar y pivotar tablas con Julia Dataframes? Digamos que tengo Dataframe using DataFrames df =DataFrame(Location = [ "NY", "SF", "NY", "NY", "SF", "SF", "TX", "TX", "TX", "DC"], Class = ["H","L","H","L","L","H", ...
Pandas DataFrame: especificación completa para __getitem __ ()? [cerrado]
Version cortaPara pandasDataframe.__getitem__(), ¿cuáles son las entradas permitidas (tipos de entrada realmente) y qué resultados produce la función como resultado? DetallesDescripción del problemaMe gustaría escribir código que haga ...
Usando plyr :: mapvalues con dplyr
plyr::mapvalues se puede usar así: mapvalues(mtcars$cyl, c(4, 6, 8), c("a", "b", "c"))Pero esto no funciona: mtcars %>% dplyr::select(cyl) %>% mapvalues(c(4, 6, 8), c("a", "b", "c")) %>% as.data.frame()Como puedo usarplyr::mapvalues condplyr? O ...
La mejor manera de configurar un marco de datos de pandas [cerrado]
Hola, soy nuevo en Pandas y acabo de encontrarmedf.query(). Por qué la gente usaríadf.query() ¿Cuándo puede filtrar directamente sus Dataframes utilizando la notación de corchetes? El tutorial oficial de pandas también parece preferir el último ...
La forma más rápida de hacer un marco de datos de tipo get_dummies a partir de una columna con un múltiplo de cadenas
Tengo una columna, 'col2', que tiene una lista de cadenas. El código actual que tengo es demasiado lento, hay alrededor de 2000 cadenas únicas (las letras en el ejemplo a continuación) y 4000 filas. Terminando como 2000 columnas y 4000 filas. In ...
Convierta la serie Pandas a DateTime en un DataFrame
Tengo un Pandas DataFrame como se muestra a continuación ReviewID ID Type TimeReviewed 205 76032930 51936827 ReportID 2015-01-15 00:05:27.513000 232 76032930 51936854 ReportID 2015-01-15 00:06:46.703000 233 76032930 51936855 ReportID 2015-01-15 ...
En tidyr, ¿qué criterios usa la función 'reunir' para mapear un marco de datos de ancho a largo?
Estoy tratando de descubrir los argumentos paragather en eltidyr paquete. Miré la documentación y la sintaxis se ve así: gather(data, key, value, ..., na.rm = FALSE, convert = FALSE) Hay unejemplo ...
Convierta la columna Pyspark Dataframe de la matriz a nuevas columnas
Tengo un Pyspark Dataframe con esta estructura: root |-- Id: string (nullable = true) |-- Q: array (nullable = true) | |-- element: struct (containsNull = true) | | |-- pr: string (nullable = true) | | |-- qt: double (nullable = true)Algo ...