Resultados de la búsqueda a petición "dataframe"

5 la respuesta

Numpy "donde" con múltiples condiciones

Intento agregar una nueva columna "clase_energía" a un marco de datos "df_energía" que contiene la cadena "alta" si el valor "consumo_energía"> 400, "medio" si el valor "consumo_energía" está entre 200 y 400, y " bajo "si el valor de" ...

3 la respuesta

Escribir Panda Dataframes en un archivo csv en fragmentos

Tengo un conjunto de archivos de datos grandes (1M filas x 20 cols). Sin embargo, solo me interesan unas 5 columnas de esos datos. Creo que puedo facilitarme las cosas creando copias de estos archivos con solo las columnas de interés, por lo que ...

5 la respuesta

¿Tiene la columna Pandas que contiene listas, cómo pivotar elementos de lista únicos a columnas?

Escribí un raspador web para extraer información de una tabla de productos y construir un marco de datos. La tabla de datos tiene una columna Descripción que contiene una cadena de atributos separados por comas que describen el producto. Quiero ...

1 la respuesta

Spark: Dataframe.subtract devuelve todo cuando la clave no es la primera en la fila

Estoy tratando de usarSQLContext.subtract () [https://spark.apache.org/docs/latest/api/python/pyspark.sql.html#pyspark.sql.DataFrame.subtract] en Spark 1.6.1 para eliminar filas de un marco de datos basado en una columna de otro marco de datos. ...

1 la respuesta

Leyendas de ggplot cuando la trama se construye desde dos marcos de datos

Tengo datos provenientes de dos marcos de datos diferentes. Estoy tratando de crear una leyenda para cada marco de datos. Sé que puedo combinar el marco de datos y hacerlo, pero debido a mi fuente de datos, tiene más sentido trazar desde dos ...

2 la respuesta

Python: soltar fila si dos columnas son NaN

Esta es una extensión deesta pregunta [https://stackoverflow.com/questions/13413590/how-to-drop-rows-of-pandas-dataframe-whose-value-of-certain-column-is-nan] , donde OP quería saber cómo colocar filas donde los valores en una sola columna son ...

4 la respuesta

Reemplazar <NA> en una columna de factor

Quiero reemplazar<NA> valores en una columna de factores con un valor válido. Pero no puedo encontrar un camino. Este ejemplo es solo para demostración. Los datos originales provienen de un archivo csv externo con el que tengo que tratar. df <- ...

5 la respuesta

Revertir la codificación 'one-hot' en Pandas

Planteamiento del problemaQuiero pasar de este marco de datos que es básicamente uno codificado en caliente. In [2]: pd.DataFrame({"monkey":[0,1,0],"rabbit":[1,0,0],"fox":[0,0,1]}) Out[2]: fox monkey rabbit 0 0 0 1 1 0 1 0 2 1 0 0 3 0 0 0 4 0 0 ...

2 la respuesta

Cómo lidiar con esta lógica compleja en los pandas python?

Tengo algunos datos como seguir estructura. Se usó en el marco de datos de pandas python y lo llamé df. Data1,Data2,Flag 2016-04-29,00:40:15,1 2016-04-29,00:40:24,2 2016-04-29,00:40:35,2 2015-04-29,00:40:36,2 ...

2 la respuesta

El valor de Groupby cuenta con los pandas del marco de datos

Tengo el siguiente marco de datos: df = pd.DataFrame([ (1, 1, 'term1'), (1, 2, 'term2'), (1, 1, 'term1'), (1, 1, 'term2'), (2, 2, 'term3'), (2, 3, 'term1'), (2, 2, 'term1') ], columns=['id', 'group', 'term'])Quiero agruparlo porid ygroup y ...