Resultados de la búsqueda a petición "dataframe"
Identificar ocurrencias consecutivas de un valor
Tengo un df así: Count 1 0 1 1 0 0 1 1 1 0y quiero devolver un1 en una nueva columna si hay dos o más ocurrencias consecutivas de1 enCount y un0 si no hay Entonces, en la nueva columna, cada fila obtendría un1 basado en este criterio que se ...
¿Cómo calcular el número de palabras en una cadena en DataFrame? [duplicar]
Esta pregunta ya tiene una respuesta aquí: Cuenta el número de palabras por fila [/questions/49984905/count-number-of-words-per-row] 4 respuestasSupongamos que tenemos un marco de datos simple df = pd.DataFrame(['one apple','banana','box of ...
Columna de cadena dinámica en Pyspark Dataframe
Tengo un marco de datos simple como este: rdd = sc.parallelize( [ (0, "A", 223,"201603", "PORT"), (0, "A", 22,"201602", "PORT"), (0, "A", 422,"201601", "DOCK"), (1,"B", 3213,"201602", "DOCK"), (1,"B", 3213,"201601", "PORT"), (2,"C", ...
PySpark convierte una columna de tipo 'mapa' en varias columnas en un marco de datos
EntradaTengo una columnaParameters de tipomap de la forma: >>> from pyspark.sql import SQLContext >>> sqlContext = SQLContext(sc) >>> d = [{'Parameters': {'foo': '1', 'bar': '2', 'baz': 'aaa'}}] >>> df = sqlContext.createDataFrame(d) >>> ...
Agregando múltiples columnas con función personalizada en Spark
Me preguntaba si hay alguna forma de especificar una función de agregación personalizada para marcos de datos de chispa en varias columnas. Tengo una tabla como esta del tipo (nombre, artículo, precio): john | tomato | 1.99 john | carrot | 0.45 ...
Marco de datos multidimensional / anidado / conjunto de datos / panel en pandas
Me gustaría almacenar algunos datos multidimensionales en un marco de datos o panel de pandas de modo que me gustaría poder devolver, por ejemplo: Todos los tiempos para el corredor A, carrera ATodos los tiempos (y nombres) para la Carrera A ...
python / pandas: convierte el mes int al nombre del mes
La mayor parte de la información que encontré no estaba en python> pandas> dataframe, de ahí la pregunta. Quiero transformar un número entero entre 1 y 12 en un nombre de mes abreviado. Tengo un df que se parece a: client Month 1 sss 02 2 yyy ...
Implementación vectorizada para crear múltiples filas desde una sola fila en el marco de datos de pandas
Para cada fila en la tabla de entrada, necesito generar varias filas separando el rango de fechas en función de cada mes. (consulte la salida de muestra a continuación). Hay un enfoque iterativo simple para convertir fila por fila, pero es muy ...
buscar más de 20 filas y mostrar el valor completo de la columna en spark-shell
estoy usandoCassandraSQLContext desde spark-shell a consultar datos de Cassandra. Por lo tanto, quiero saber dos cosas: cómo obtener más de 20 filas usandoCassandraSQLContext y segundo, ¿cómo mostrar Id el valor completo de la columna? Como puede ...
¿Cómo construir una columna de marco de datos recursivamente con pandas-python?
Dar tal marco de datosdf: id_ val 11111 12 12003 22 88763 19 43721 77 ...Deseo agregar una columnadiff adf, y cada fila es igual a, digamos, elval en esa fila menos eldiff en la fila anterior y multiplique 0.4 y luego agreguediff en el día ...