Resultados de la búsqueda a petición "pandas"
Promedio del recuento diario de registros por mes en un Pandas DataFrame
Tengo un DataFrame de pandas con unTIMESTAMP columna, que es del tipo de datos datetime64. Tenga en cuenta que inicialmente esta columna no está configurada como índice; el índice es solo enteros regulares, y las primeras filas se ...
¿Cómo maneja Spark DataFrame el Pandas DataFrame que es más grande que la memoria?
Ahora estoy aprendiendo Spark, y parece ser la solución de Big Data para Pandas Dataframe, pero tengo esta pregunta que me hace inseguro. Actualmente estoy almacenando marcos de datos Pandas que son más grandes que la memoria usando HDF5. HDF5 ...
Guardar en un archivo una matriz o DataFrame junto con otra información
El software estadísticoStata [https://www.stata.com/]permite guardar fragmentos de texto cortos dentro de un conjunto de datos. Esto se logra usandonotes [https://www.stata.com/manuals13/dnotes.pdf]y / ...
Abrir carpeta con extensión .gl en python o pandas
Descargué algunos datos de un curso en línea que estoy siguiendo. Una vez descomprimido, genera una carpeta llamada home.gl (la carpeta viene con esa extensión gl) y dentro de esa carpeta están estos extraños archivos de extensión. En el curso ...
series de tiempo nacidas del marco de datos de pandas
Estoy luchando con lo que parece ser un problema muy fácil: cómo hacer que Seaborn trace un gráfico de líneas de series de tiempo desde un marco de datos de pandas. ¿Qué estoy haciendo mal aquí? import seaborn as sns import pandas as ...
pandas DataFrame cómo mezclar gráficos de barras y líneas con diferentes escalas
Estoy tratando de hacer que los pandas superpongan un diagrama de barras y un diagrama lineal. Las dos series tienen escalas diferentes, por lo que quiero que los valores se tracen en dos ejes "y". No puedo hacer que los pandas muestren las ...
¿Cómo hacer un marco de datos 1 por n de series en pandas?
Tengo un gran marco de datos, y lo indexo así: df.ix[<integer>] Dependiendo del índice, a veces esto tendrá solo una fila de valores. Pandas convierte esto automáticamente en una serie, lo que, francamente, es molesto porque no puedo operarlo ...
Marco de datos de pandas read_csv en datos incorrectos
Quiero leer en un csv muy grande (no se puede abrir en Excel y editar fácilmente), pero en algún lugar alrededor de la fila 100,000, hay una fila con una columna adicional que hace que el programa se bloquee. Esta fila tiene errores, por lo que ...
¿Dónde está el valor cuando hago esto en la serie pandas
tengo el siguiente código. s2 = pd.Series([100,"PYTHON","Soochow","Qiwsir"], index=["mark","title","university","name"]) s2.mark = "102" s2.price = "100" Cuando imprimos2 , Puedo ver que el valor de la marca fue cambiado y no hay precio; pero ...
fusionando dos marcos de datos de pandas en la marca de tiempo más cercana
Tengo dos daframes df1 y df2 df1 es time status 2/2/2015 8.00 am on time 2/2/2015 9.00 am canceled 2/2/2015 10.30 am on time 2/2/2015 12.45 pm on timedf2 es w_time temp 2/2/2015 8.00 am 45 2/2/2015 8.50 am 46 2/2/2015 9.40 am 47 2/2/2015 10.15 ...