Resultados de la búsqueda a petición "dataframe"

2 la respuesta

Identificar ocurrencias consecutivas de un valor

Tengo un df así: Count 1 0 1 1 0 0 1 1 1 0y quiero devolver un1 en una nueva columna si hay dos o más ocurrencias consecutivas de1 enCount y un0 si no hay Entonces, en la nueva columna, cada fila obtendría un1 basado en este criterio que se ...

2 la respuesta

¿Cómo calcular el número de palabras en una cadena en DataFrame? [duplicar]

Esta pregunta ya tiene una respuesta aquí: Cuenta el número de palabras por fila [/questions/49984905/count-number-of-words-per-row] 4 respuestasSupongamos que tenemos un marco de datos simple df = pd.DataFrame(['one apple','banana','box of ...

1 la respuesta

Columna de cadena dinámica en Pyspark Dataframe

Tengo un marco de datos simple como este: rdd = sc.parallelize( [ (0, "A", 223,"201603", "PORT"), (0, "A", 22,"201602", "PORT"), (0, "A", 422,"201601", "DOCK"), (1,"B", 3213,"201602", "DOCK"), (1,"B", 3213,"201601", "PORT"), (2,"C", ...

1 la respuesta

PySpark convierte una columna de tipo 'mapa' en varias columnas en un marco de datos

EntradaTengo una columnaParameters de tipomap de la forma: >>> from pyspark.sql import SQLContext >>> sqlContext = SQLContext(sc) >>> d = [{'Parameters': {'foo': '1', 'bar': '2', 'baz': 'aaa'}}] >>> df = sqlContext.createDataFrame(d) >>> ...

4 la respuesta

Agregando múltiples columnas con función personalizada en Spark

Me preguntaba si hay alguna forma de especificar una función de agregación personalizada para marcos de datos de chispa en varias columnas. Tengo una tabla como esta del tipo (nombre, artículo, precio): john | tomato | 1.99 john | carrot | 0.45 ...

2 la respuesta

Marco de datos multidimensional / anidado / conjunto de datos / panel en pandas

Me gustaría almacenar algunos datos multidimensionales en un marco de datos o panel de pandas de modo que me gustaría poder devolver, por ejemplo: Todos los tiempos para el corredor A, carrera ATodos los tiempos (y nombres) para la Carrera A ...

8 la respuesta

python / pandas: convierte el mes int al nombre del mes

La mayor parte de la información que encontré no estaba en python> pandas> dataframe, de ahí la pregunta. Quiero transformar un número entero entre 1 y 12 en un nombre de mes abreviado. Tengo un df que se parece a: client Month 1 sss 02 2 yyy ...

2 la respuesta

Implementación vectorizada para crear múltiples filas desde una sola fila en el marco de datos de pandas

Para cada fila en la tabla de entrada, necesito generar varias filas separando el rango de fechas en función de cada mes. (consulte la salida de muestra a continuación). Hay un enfoque iterativo simple para convertir fila por fila, pero es muy ...

2 la respuesta

buscar más de 20 filas y mostrar el valor completo de la columna en spark-shell

estoy usandoCassandraSQLContext desde spark-shell a consultar datos de Cassandra. Por lo tanto, quiero saber dos cosas: cómo obtener más de 20 filas usandoCassandraSQLContext y segundo, ¿cómo mostrar Id el valor completo de la columna? Como puede ...

3 la respuesta

¿Cómo construir una columna de marco de datos recursivamente con pandas-python?

Dar tal marco de datosdf: id_ val 11111 12 12003 22 88763 19 43721 77 ...Deseo agregar una columnadiff adf, y cada fila es igual a, digamos, elval en esa fila menos eldiff en la fila anterior y multiplique 0.4 y luego agreguediff en el día ...