Resultados de la búsqueda a petición "dataframe"
eliminar filas específicas en el marco de datos con pandas
Necesito ayuda de todos ustedes. Estoy trabajando con un formulario de datos de Excel, así que básicamente ahora tengo algo como esto. csr id ac otc tm lease maint 1 456 b 0 0 0 0 1 543 a 0 1 1 0 1 435 e 0 0 0 0 2 123 w 1 1 1 1 2 123 g 0 0 0 0 3 ...
¿Cómo combinar todas las filas en una sola fila? [cerrado]
Tengo un marco de datos que tiene 100 filas y 10 columnas, me pregunto cómo puedo combinar todas las 100 filas en una sola fila. Gracias. mydata=seq(1,1000) mydata=as.data.frame(matrix(mydata,nrow = 100,ncol = 10,byrow=T)) the result should be ...
¿Cómo agrupar un conjunto de objetos data.frame en una lista anidada con un orden diferente?
He establecido un objeto data.frame en una lista anidada, quiero agruparlos por nombre del objeto data.frame. Debido a que cada lista anidada, los objetos data.frame se colocan en un orden diferente, tengo dificultades para agruparlos en una ...
Recupere los primeros n en cada grupo de un DataFrame en pyspark
Hay un DataFrame en pyspark con los siguientes datos: user_id object_id score user_1 object_1 3 user_1 object_1 1 user_1 object_2 2 user_2 object_1 5 user_2 object_2 2 user_2 object_2 6Lo que espero es devolver 2 registros en cada grupo con el ...
¿Cómo escribir datos en Redshift que son el resultado de un marco de datos creado en Python?
Tengo un marco de datos en Python. ¿Puedo escribir estos datos en Redshift como una nueva tabla? He creado con éxito una conexión db a Redshift y puedo ejecutar consultas sql simples. Ahora necesito escribirle un marco de datos.
¿Cuándo aplicar (pd.to_numeric) y cuándo aplicar un tipo (np.float64) en python?
Tengo un objeto Pandas DataFrame llamadoxiv que tiene una columna deint64 Mediciones de volumen. In[]: xiv['Volume'].head(5) Out[]: 0 252000 1 484000 2 62000 3 168000 4 232000 Name: Volume, dtype: int64He leído otras publicaciones ...
Cómo convertir una columna con una lista de valores en filas en Pandas DataFrame
Hola, tengo un marco de datos como este: A B 0: some value [[L1, L2]]Quiero cambiarlo a: A B 0: some value L1 1: some value L2¿Cómo puedo hacer eso?
División de diccionario / lista dentro de una columna Pandas en columnas separadas
Tengo datos guardados en una base de datos postgreSQL. Estoy consultando estos datos usando Python2.7 y convirtiéndolos en un Pandas DataFrame. Sin embargo, la última columna de este marco de datos tiene un diccionario (¿o una lista?) De valores ...
¿Definir un UDF que acepte una matriz de objetos en un Spark DataFrame?
Al trabajar con los marcos de datos de Spark, se requieren funciones definidas por el usuario (UDF) para asignar datos en columnas. Las UDF requieren que los tipos de argumento se especifiquen explícitamente. En mi caso, necesito manipular una ...
Identifique la fecha de los cambios de valor y resuma los datos con sum () y diff () en R
Data de muestra: product_id <- c("1000","1000","1000","1000","1000","1000", "1002","1002","1002","1002","1002","1002") qty_ordered <- c(1,2,1,1,1,1,1,2,1,2,1,1) price <- c(2.49,2.49,2.49,1.743,2.49,2.49, 2.093,2.093,2.11,2.11,2.11, 2.97) date <- ...