Resultados de la búsqueda a petición "pandas"
Actualización de pandas a la versión 0.19 en Azure ML Studio
Realmente me gustaría tener acceso a algunas de las funciones actualizadas en pandas 0.19, pero Azure ML studio usa pandas 0.18 como parte del paquete Anaconda 4.0. ¿Hay alguna forma de actualizar la versión que se utiliza dentro de los ...
Cambiar valores de columna a encabezados de columna en pandas
Tengo el siguiente código, que toma los valores en una columna de un marco de datos de pandas y los convierte en las columnas de un nuevo marco de datos. Los valores en la primera columna del marco de datos se convierten en el índice del nuevo ...
Pandas Dataframe mostrar en una página web
Estoy usando Flask pero esto probablemente se aplica a muchos marcos similares. Construyo un marco de datos de pandas, p. @app.route('/analysis/<filename>') def analysis(filename): x = pd.DataFrame(np.random.randn(20, 5)) return ...
Pandas: obtenga la primera agrupación por teclas
Si tengo el siguiente marco de datos | id | timestamp | code | id2 | 10 | 2017-07-12 13:37:00 | 206 | a1 | 10 | 2017-07-12 13:40:00 | 206 | a1 | 10 | 2017-07-12 13:55:00 | 206 | a1 | 10 | 2017-07-12 19:00:00 | 206 | a2 | 11 | 2017-07-12 13:37:00 ...
MultiIndex Group By en Pandas Data Frame
Tengo un conjunto de datos que contiene países y estadísticas sobre indicadores económicos por año, organizados así: Country Metric 2011 2012 2013 2014 USA GDP 7 4 0 2 USA Pop. 2 3 0 3 GB GDP 8 7 0 7 GB Pop. 2 6 0 0 FR GDP 5 0 0 1 FR Pop. 1 1 0 ...
Numpy hstack - "ValueError: todas las matrices de entrada deben tener el mismo número de dimensiones" - pero lo hacen
Estoy tratando de unir dos matrices numpy. En uno tengo un conjunto de columnas / características después de ejecutar TF-IDF en una sola columna de texto. En el otro tengo una columna / característica que es un número entero. Entonces leí en una ...
Lea una pequeña muestra aleatoria de un gran archivo CSV en un marco de datos de Python
El archivo CSV que quiero leer no cabe en la memoria principal. ¿Cómo puedo leer algunas líneas aleatorias (~ 10K) y hacer algunas estadísticas simples en el marco de datos seleccionado?
¿Cómo obtengo un recuento resumido de datos faltantes / NaN por columna en 'pandas'?
EnR Puedo ver rápidamente un recuento de datos faltantes usando elsummary comando, pero el equivalentepandas Método DataFrame,describe no informa estos valores. Supongo que puedo hacer algo como len(mydata.index) - mydata.count()para calcular ...
agrupando filas en la lista en pandas groupby
Tengo un marco de datos de pandas como: A 1 A 2 B 5 B 5 B 4 C 6Quiero agrupar por la primera columna y obtener la segunda columna como listas en filas: A [1,2] B [5,5,4] C [6]¿Es posible hacer algo así usando pandas groupby?
Calcular estadísticas de resumen de columnas en el marco de datos
Tengo un marco de datos de la siguiente forma (por ejemplo) shopper_num,is_martian,number_of_items,count_pineapples,birth_country,tranpsortation_method 1,FALSE,0,0,MX, 2,FALSE,1,0,MX, 3,FALSE,0,0,MX, 4,FALSE,22,0,MX, ...