Resultados de la búsqueda a petición "pandas"

1 la respuesta

Creación ficticia en tubería con diferentes niveles en el tren y el conjunto de prueba

Actualmente estoy explorando las tuberías de aprendizaje de scikit. También quiero preprocesar los datos con una tubería. Sin embargo, mis datos de tren y prueba tienen diferentes niveles de la variable categórica. Ejemplo: considere: import ...

1 la respuesta

los pandas eliminan segundos del índice de fecha y hora

Tengo un marco de datos de pandas llamado 'df' de la siguiente manera value 2015-09-27 03:58:30 1.0 2015-09-27 03:59:30 1.0 2015-09-27 04:00:30 1.0 2015-09-27 04:01:30 1.0Solo quiero quitarme los segundos para obtener esto value 2015-09-27 ...

1 la respuesta

¿Cómo puedo leer el archivo tar.gz usando pandas read_csv con la opción de compresión gzip?

Tengo un csv muy simple, con los siguientes datos, comprimido dentro del archivo tar.gz. Necesito leer eso en el marco de datos usando pandas.read_csv. A B 0 1 4 1 2 5 2 3 6 import pandas as pd pd.read_csv("sample.tar.gz",compression='gzip')Sin ...

14 la respuesta

"El archivo CSV no existe" - Pandas Dataframe

Actualmente estoy aprendiendo Pandas para el análisis de datos y tengo algunos problemas para leer un archivo csv en el editor Atom. Cuando estoy ejecutando el siguiente código: import pandas as pd df = pd.read_csv("FBI-CRIME11.csv") ...

1 la respuesta

Pandas: la explicación sobre la función de aplicación es lenta

La función Aplicar parece funcionar muy lentamente con un gran marco de datos (aproximadamente 1 ~ 3 millones de filas). He comprobado preguntas relacionadas aquí, comoAcelerar la función de aplicación de ...

2 la respuesta

Crear columnas dinámicas en el marco de datos usando pandas

Cómo crear columnas dinámicas a partir de este marco de datos de pandas. Name, Sex a, M b, F c, M d, FMarco de datos esperado: Name, M, F a, 1, 0 b, 0, 1 c, 1, 0 d, 0, 1He intentado pandas.pivot () pero no sirve de nada, ¿podrían sugerirme algo?

1 la respuesta

DataFrame con MultiIndex para dictar

Tengo un marco de datos con un MultiIndex. Me pregunto si creé el marco de datos de la manera correcta (ver más abajo). 01.01 02.01 03.01 04.01 bar total1 40 52 18 11 total2 36 85 5 92 baz total1 23 39 45 70 total2 50 49 51 65 foo total1 23 97 ...

1 la respuesta

¿Cómo importar un archivo gzip mayor que el límite de RAM en un Pandas DataFrame? "Kill 9" ¿Usa HDF5?

tengo ungzip que es de aproximadamente 90 GB. Esto está bien dentro del espacio en disco, pero mucho más grande que la RAM. ¿Cómo puedo importar esto a un marco de datos de pandas? Intenté lo siguiente en la línea de comando: # start with ...

4 la respuesta

Cómo agregar números incrementales a una nueva columna usando pandas

Tengo este marco de datos simplificado: ID Fruit F1 Apple F2 Orange F3 BananaQuiero agregar al comienzo del marco de datos una nueva columnadf['New_ID'] cual tiene el numero880 que se incrementa en uno en cada fila. La salida debería ser ...

2 la respuesta

Especificar el orden de las columnas después de la agrupación por agrupación

El orden de mis columnas de edad, altura y peso está cambiando con cada ejecución del código. Necesito mantener el orden de mis columnas agg estáticas porque finalmente me refiero a este archivo de salida de acuerdo con las ubicaciones de las ...