Resultados de la búsqueda a petición "dataframe"
¿Cómo iterar sobre los niveles de MultiIndex en Pandas?
A menudo tengo índices MultiIndex y me gustaría iterar sobre grupos donde los índices de nivel superior son iguales. Básicamente parece from random import choice import pandas as pd N = 100 df = pd.DataFrame([choice([1, 2, 3]) for _ in ...
Spark agrega una nueva columna al marco de datos con el valor de la fila anterior
Me pregunto cómo puedo lograr lo siguiente en Spark (Pyspark) Marco de datos inicial: +--+---+ |id|num| +--+---+ |4 |9.0| +--+---+ |3 |7.0| +--+---+ |2 |3.0| +--+---+ |1 |5.0| +--+---+Marco de datos resultante: +--+---+-------+ ...
Concatenar índice y cadena a nueva columna
Tengo un marco de datos de 3 columnas (incluido el índice): name age 0 satya 24 1 abc 26 2 xyz 29 3 def 32así que necesito agregar una nueva columnadetail que almacenará el nombre del archivo de detalle y el valor en esa columna debería ser ...
Python pandas: aplica la función con dos argumentos a las columnas
¿Puedes hacer que los pandas de Python funcionen con valores en dos columnas diferentes como argumentos? Tengo una función que devuelve un 1 si dos columnas tienen valores en el mismo rango. de lo contrario, devuelve 0: def ...
read_csv con encabezado faltante / incompleto o número irregular de columnas
tengo unfile.csv con ~ 15k filas que se ve así SAMPLE_TIME, POS, OFF, HISTOGRAM 2015-07-15 16:41:56, 0-0-0-0-3, 1, 2,0,5,59,0,0,0,0,0,2,0,0,0,0,0,0,0,0,0, 2015-07-15 16:42:55, 0-0-0-0-3, 1, 0,0,5,9,0,0,0,0,0,2,0,0,0,50,0, 2015-07-15 16:43:55, ...
Agregar una columna específica de un marco de datos de pandas a otro marco de datos de pandas
Estoy tratando de agregar una columna a un marco de datos de pandas (df1) que tiene una columna de identificador único ('id') de otro marco de datos (df2) que tiene el mismo identificador único ('sameid'). He intentado fusionar, pero ...
Fusionar marcos de datos de diferentes tamaños
Tengo dos marcos de datosd1 yd2 respectivamente como: x y z 10 10 7 10 12 6 11 10 8 11 12 2 12 10 1 12 12 5 x y z 10 10 100 11 10 200 12 12 400Quiero algo como: x y z 10 10 100 10 12 6 11 10 200 11 12 2 12 10 1 12 12 400Realmente lamento ...
Subconjunto data.frame por columna
Tengo este data.frame: a <- c(rep("1", 3), rep("2", 3), rep("3",3), rep("4",3), rep("5",3)) b <- c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15) df <-data.frame(a,b) a b 1 1 1 2 1 2 3 1 3 4 2 4 5 2 5 6 2 6 7 3 7 8 3 8 9 3 9 10 4 10 11 4 11 12 4 12 13 5 ...
¿Cómo convierto una columna WrappedArray en el marco de datos de spark a Strings?
Estoy tratando de convertir una columna que contiene Array [String] a String, pero constantemente aparece este error org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 78.0 failed 4 times, most recent failure: ...
Subconjunto de un marco de datos basado en el contenido de otro marco de datos
Tengo dos data.frames. Por ejemplo, digamos que se ven así: df1 <- data.frame(x=rep(letters[1:26], 16)) df2 <- data.frame(y=letters[1:4])Lo que me gustaría hacer es el subconjunto 'df1' para contener las filas cuyo primer valor de columna ...