Resultados de la búsqueda a petición "dataframe"

3 la respuesta

Niveles de factor de unión de dos columnas

Tengo 2 columnas de datos con el mismo tipo de datos (cadenas). Quiero unir los niveles de las columnas. es decir. tenemos: col1 col2 Bob John Tom Bob Frank Jane Jim Bob Tom Bob ... ... (and so on)ahora col1 tiene 4 niveles (Bob, Tom Frank, ...

3 la respuesta

R: agrega una columna que cuenta secuencialmente dentro de los grupos pero que se repite para duplicados

Estoy buscando una solución para agregar la columna "deseado_resultado" preferiblemente usando dplyr y / o ave (). Vea el marco de datos aquí, donde el grupo es "sección" y las instancias únicas que quiero que mi columna "deseado_resultados" ...

5 la respuesta

Julia Dataframe agrupar por y funciones de tablas dinámicas

¿Cómo agrupar y pivotar tablas con Julia Dataframes? Digamos que tengo Dataframe using DataFrames df =DataFrame(Location = [ "NY", "SF", "NY", "NY", "SF", "SF", "TX", "TX", "TX", "DC"], Class = ["H","L","H","L","L","H", ...

1 la respuesta

Pandas DataFrame: especificación completa para __getitem __ ()? [cerrado]

Version cortaPara pandasDataframe.__getitem__(), ¿cuáles son las entradas permitidas (tipos de entrada realmente) y qué resultados produce la función como resultado? DetallesDescripción del problemaMe gustaría escribir código que haga ...

1 la respuesta

Usando plyr :: mapvalues con dplyr

plyr::mapvalues se puede usar así: mapvalues(mtcars$cyl, c(4, 6, 8), c("a", "b", "c"))Pero esto no funciona: mtcars %>% dplyr::select(cyl) %>% mapvalues(c(4, 6, 8), c("a", "b", "c")) %>% as.data.frame()Como puedo usarplyr::mapvalues condplyr? O ...

2 la respuesta

La mejor manera de configurar un marco de datos de pandas [cerrado]

Hola, soy nuevo en Pandas y acabo de encontrarmedf.query(). Por qué la gente usaríadf.query() ¿Cuándo puede filtrar directamente sus Dataframes utilizando la notación de corchetes? El tutorial oficial de pandas también parece preferir el último ...

1 la respuesta

La forma más rápida de hacer un marco de datos de tipo get_dummies a partir de una columna con un múltiplo de cadenas

Tengo una columna, 'col2', que tiene una lista de cadenas. El código actual que tengo es demasiado lento, hay alrededor de 2000 cadenas únicas (las letras en el ejemplo a continuación) y 4000 filas. Terminando como 2000 columnas y 4000 filas. In ...

2 la respuesta

Convierta la serie Pandas a DateTime en un DataFrame

Tengo un Pandas DataFrame como se muestra a continuación ReviewID ID Type TimeReviewed 205 76032930 51936827 ReportID 2015-01-15 00:05:27.513000 232 76032930 51936854 ReportID 2015-01-15 00:06:46.703000 233 76032930 51936855 ReportID 2015-01-15 ...

1 la respuesta

En tidyr, ¿qué criterios usa la función 'reunir' para mapear un marco de datos de ancho a largo?

Estoy tratando de descubrir los argumentos paragather en eltidyr paquete. Miré la documentación y la sintaxis se ve así: gather(data, key, value, ..., na.rm = FALSE, convert = FALSE) Hay unejemplo ...

2 la respuesta

Convierta la columna Pyspark Dataframe de la matriz a nuevas columnas

Tengo un Pyspark Dataframe con esta estructura: root |-- Id: string (nullable = true) |-- Q: array (nullable = true) | |-- element: struct (containsNull = true) | | |-- pr: string (nullable = true) | | |-- qt: double (nullable = true)Algo ...