Resultados de la búsqueda a petición "pandas"

2 la respuesta

Actualización de pandas a la versión 0.19 en Azure ML Studio

Realmente me gustaría tener acceso a algunas de las funciones actualizadas en pandas 0.19, pero Azure ML studio usa pandas 0.18 como parte del paquete Anaconda 4.0. ¿Hay alguna forma de actualizar la versión que se utiliza dentro de los ...

1 la respuesta

Cambiar valores de columna a encabezados de columna en pandas

Tengo el siguiente código, que toma los valores en una columna de un marco de datos de pandas y los convierte en las columnas de un nuevo marco de datos. Los valores en la primera columna del marco de datos se convierten en el índice del nuevo ...

3 la respuesta

Pandas Dataframe mostrar en una página web

Estoy usando Flask pero esto probablemente se aplica a muchos marcos similares. Construyo un marco de datos de pandas, p. @app.route('/analysis/<filename>') def analysis(filename): x = pd.DataFrame(np.random.randn(20, 5)) return ...

2 la respuesta

Pandas: obtenga la primera agrupación por teclas

Si tengo el siguiente marco de datos | id | timestamp | code | id2 | 10 | 2017-07-12 13:37:00 | 206 | a1 | 10 | 2017-07-12 13:40:00 | 206 | a1 | 10 | 2017-07-12 13:55:00 | 206 | a1 | 10 | 2017-07-12 19:00:00 | 206 | a2 | 11 | 2017-07-12 13:37:00 ...

2 la respuesta

MultiIndex Group By en Pandas Data Frame

Tengo un conjunto de datos que contiene países y estadísticas sobre indicadores económicos por año, organizados así: Country Metric 2011 2012 2013 2014 USA GDP 7 4 0 2 USA Pop. 2 3 0 3 GB GDP 8 7 0 7 GB Pop. 2 6 0 0 FR GDP 5 0 0 1 FR Pop. 1 1 0 ...

3 la respuesta

Numpy hstack - "ValueError: todas las matrices de entrada deben tener el mismo número de dimensiones" - pero lo hacen

Estoy tratando de unir dos matrices numpy. En uno tengo un conjunto de columnas / características después de ejecutar TF-IDF en una sola columna de texto. En el otro tengo una columna / característica que es un número entero. Entonces leí en una ...

8 la respuesta

Lea una pequeña muestra aleatoria de un gran archivo CSV en un marco de datos de Python

El archivo CSV que quiero leer no cabe en la memoria principal. ¿Cómo puedo leer algunas líneas aleatorias (~ 10K) y hacer algunas estadísticas simples en el marco de datos seleccionado?

4 la respuesta

¿Cómo obtengo un recuento resumido de datos faltantes / NaN por columna en 'pandas'?

EnR Puedo ver rápidamente un recuento de datos faltantes usando elsummary comando, pero el equivalentepandas Método DataFrame,describe no informa estos valores. Supongo que puedo hacer algo como len(mydata.index) - mydata.count()para calcular ...

6 la respuesta

agrupando filas en la lista en pandas groupby

Tengo un marco de datos de pandas como: A 1 A 2 B 5 B 5 B 4 C 6Quiero agrupar por la primera columna y obtener la segunda columna como listas en filas: A [1,2] B [5,5,4] C [6]¿Es posible hacer algo así usando pandas groupby?

3 la respuesta

Calcular estadísticas de resumen de columnas en el marco de datos

Tengo un marco de datos de la siguiente forma (por ejemplo) shopper_num,is_martian,number_of_items,count_pineapples,birth_country,tranpsortation_method 1,FALSE,0,0,MX, 2,FALSE,1,0,MX, 3,FALSE,0,0,MX, 4,FALSE,22,0,MX, ...