Resultados de la búsqueda a petición "pandas"

3 la respuesta

Python pandas: pd.melt un marco de datos con resultados de índice de fecha y hora en NaN

Tengo el siguiente marco de datos (sim_2005): Date ELEM1 ELEM2 ... ELEM1133 2005-01-01 0.021 2.455 ... 345.2 2005-01-02 0.321 2.331 ... 355.1 ... ... ... ... ... 2005-12-31 0.789 3.456 ... 459.9 [365 rows x 1133 columns]conDate ser ...

1 la respuesta

Requisitos para convertir el marco de datos de Spark en el marco de datos de Pandas / R

Estoy ejecutando Spark en HADOop's YARN. ¿Cómo funciona esta conversión? ¿Se realiza un collect () antes de la conversión? ¿También necesito instalar Python y R en cada nodo esclavo para que la conversión funcione? Estoy luchando por encontrar ...

5 la respuesta

Trazar datos categóricos con pandas y matplotlib

Tengo un marco de datos con datos categóricos: colour direction 1 red up 2 blue up 3 green down 4 red left 5 red right 6 yellow down 7 blue downQuiero generar algunos gráficos, como gráficos circulares e histogramas basados en las categorías. ...

1 la respuesta

¿Cómo puedo obtener pandas Timestamp offset por cierta cantidad de meses?

Supongamos que tengo un objeto pandas Timestamp t1. import pandas a pd t1=pd.Timestamp('2013-04-01 00:00:00')¿Cómo puedo obtener otra marca de tiempo de pandas, compensada por k meses de t1?

2 la respuesta

Desglosar la columna de la lista en varias filas

Quiero expandir la lista en una determinada columna (en el ejemplo column_x) a varias filas. Entonces df = pd.DataFrame({'column_a': ['a_1', 'a_2'], 'column_b': ['b_1', 'b_2'], 'column_x': [['c_1', 'c_2'], ['d_1', 'd_2']] })será transformado ...

1 la respuesta

reste dos columnas de Dataframe diferente con python

Tengo dos DataFrames, df1: Lat1 Lon1 tp1 0 34.475000 349.835000 1 1 34.476920 349.862065 0.5 2 34.478833 349.889131 0 3 34.480739 349.916199 3 4 34.482639 349.943268 0 5 34.484532 349.970338 0y df2: Lat2 Lon2 tp2 0 34.475000 349.835000 2 1 ...

3 la respuesta

Plano de pyspark en pandas

¿Hay una operación en pandas que haga lo mismo quemapa plano [http://spark.apache.org/docs/latest/api/python/pyspark.html#pyspark.RDD.flatMap] en pyspark? Ejemplo de flatMap: >>> rdd = sc.parallelize([2, 3, 4]) >>> sorted(rdd.flatMap(lambda x: ...

1 la respuesta

¿Cómo evitar la notación científica al anotar un mapa de clúster marino?

Tengo un marco de datos que contiene porcentajes. Si uso seaborn para hacer un clusterplot [http://stanford.edu/~mwaskom/software/seaborn/examples/structured_heatmap.html] de alguna manera el número100 se traza como1+e01. Hay alguna manera de ...

2 la respuesta

Transforme un objeto de contador en un marco de datos de pandas

solíaCounter en una lista para calcular esta variable: final = Counter(event_container)impresión final da: Counter({'fb_view_listing': 76, 'fb_homescreen': 63, 'rt_view_listing': 50, 'rt_home_start_app': 46, 'fb_view_wishlist': 39, ...

2 la respuesta

Seleccione el índice inverso en pd.

Cómo seleccionar el índice inverso en pd.DataFrame utilizandoloc oiloc? Lo intentédf.loc[!my_index,my_feature] pero fallar Ydf.loc[[ind for ind in df.index.tolist() if ind not in my_index],my_feature] se ve muy aburrido. ¿Alguna mejor idea?