Resultados de la búsqueda a petición "dataframe"
Numpy "donde" con múltiples condiciones
Intento agregar una nueva columna "clase_energía" a un marco de datos "df_energía" que contiene la cadena "alta" si el valor "consumo_energía"> 400, "medio" si el valor "consumo_energía" está entre 200 y 400, y " bajo "si el valor de" ...
Escribir Panda Dataframes en un archivo csv en fragmentos
Tengo un conjunto de archivos de datos grandes (1M filas x 20 cols). Sin embargo, solo me interesan unas 5 columnas de esos datos. Creo que puedo facilitarme las cosas creando copias de estos archivos con solo las columnas de interés, por lo que ...
¿Tiene la columna Pandas que contiene listas, cómo pivotar elementos de lista únicos a columnas?
Escribí un raspador web para extraer información de una tabla de productos y construir un marco de datos. La tabla de datos tiene una columna Descripción que contiene una cadena de atributos separados por comas que describen el producto. Quiero ...
Spark: Dataframe.subtract devuelve todo cuando la clave no es la primera en la fila
Estoy tratando de usarSQLContext.subtract () [https://spark.apache.org/docs/latest/api/python/pyspark.sql.html#pyspark.sql.DataFrame.subtract] en Spark 1.6.1 para eliminar filas de un marco de datos basado en una columna de otro marco de datos. ...
Leyendas de ggplot cuando la trama se construye desde dos marcos de datos
Tengo datos provenientes de dos marcos de datos diferentes. Estoy tratando de crear una leyenda para cada marco de datos. Sé que puedo combinar el marco de datos y hacerlo, pero debido a mi fuente de datos, tiene más sentido trazar desde dos ...
Python: soltar fila si dos columnas son NaN
Esta es una extensión deesta pregunta [https://stackoverflow.com/questions/13413590/how-to-drop-rows-of-pandas-dataframe-whose-value-of-certain-column-is-nan] , donde OP quería saber cómo colocar filas donde los valores en una sola columna son ...
Reemplazar <NA> en una columna de factor
Quiero reemplazar<NA> valores en una columna de factores con un valor válido. Pero no puedo encontrar un camino. Este ejemplo es solo para demostración. Los datos originales provienen de un archivo csv externo con el que tengo que tratar. df <- ...
Revertir la codificación 'one-hot' en Pandas
Planteamiento del problemaQuiero pasar de este marco de datos que es básicamente uno codificado en caliente. In [2]: pd.DataFrame({"monkey":[0,1,0],"rabbit":[1,0,0],"fox":[0,0,1]}) Out[2]: fox monkey rabbit 0 0 0 1 1 0 1 0 2 1 0 0 3 0 0 0 4 0 0 ...
Cómo lidiar con esta lógica compleja en los pandas python?
Tengo algunos datos como seguir estructura. Se usó en el marco de datos de pandas python y lo llamé df. Data1,Data2,Flag 2016-04-29,00:40:15,1 2016-04-29,00:40:24,2 2016-04-29,00:40:35,2 2015-04-29,00:40:36,2 ...
El valor de Groupby cuenta con los pandas del marco de datos
Tengo el siguiente marco de datos: df = pd.DataFrame([ (1, 1, 'term1'), (1, 2, 'term2'), (1, 1, 'term1'), (1, 1, 'term2'), (2, 2, 'term3'), (2, 3, 'term1'), (2, 2, 'term1') ], columns=['id', 'group', 'term'])Quiero agruparlo porid ygroup y ...