Resultados de la búsqueda a petición "pandas"

2 la respuesta

pandas to_datetime () luego concat () en DateTime Index

Estoy tratando de fusionar 2 DataFrames usandoconcat, en su Índice DateTime, pero no funciona como esperaba. Copié parte de este código del ejemplo en ...

4 la respuesta

encontrar nombres de columnas numéricas en pandas

Necesito seleccionar columnas en Pandas que contengan solo valores numéricos en los nombres de columna, por ejemplo: df= 0 1 2 3 4 window_label next_states ids 0 17.0 18.0 16.0 15.0 15.0 ddddd d 13.0 1 18.0 16.0 15.0 15.0 16.0 ddddd d 13.0 2 ...

1 la respuesta

MultiIndex / Reformulación de las diferencias entre las versiones de Pandas

Tengo un DataFrame con el siguiente código: import pandas as pd import numpy as np index = pd.DatetimeIndex(['2017-05-04', '2017-05-05', '2017-05-08', '2017-05-09', '2017-05-10'], dtype='datetime64[ns]',name = 'date', freq='B') columns ...

6 la respuesta

Cómo eliminar caracteres ilegales para que un marco de datos pueda escribir en Excel

Estoy tratando de escribir un marco de datos en una hoja de cálculo de Excel usando ExcelWriter, pero sigue apareciendo un error: openpyxl.utils.exceptions.IllegalCharacterErrorSupongo que hay algún carácter en el marco de datos que a ...

3 la respuesta

drop_duplicates no funciona en pandas?

El propósito de mi código es importar 2 archivos de Excel, compararlos e imprimir las diferencias en un nuevo archivo de Excel. Sin embargo, después de concatenar todos los datos y usar eldrop_duplicates función, el código es aceptado por la ...

1 la respuesta

Combinar dos conjuntos de datos en pandas

Anteriormente trabajé con Stata y ahora estoy tratando de hacer lo mismo con Python. Sin embargo, tengo problemas con el comando de combinación. De alguna manera debo estar perdiendo algo. Mis dos marcos de datos que quiero fusionar se ven ...

3 la respuesta

Python Pandas: encuentre un grupo consecutivo con valores agregados máximos

Tengo un marco de datos con fechas y números enteros import numpy as np import pandas as pd df = pd.DataFrame() df['dt'] = pd.date_range("2017-01-01 12:00", "2017-01-01 12:30", freq="1min") df['val'] = np.random.choice(xrange(1, 100), ...

3 la respuesta

Pandas read_csv acelerar

Estoy leyendo un csv grande que tiene alrededor de 10 millones de filas y 20 columnas diferentes (con nombres de encabezado). Tengo valores, 2 columnas con fechas y algunas cadenas. Actualmente me lleva alrededor de 1,5 minutos cargar los datos ...

3 la respuesta

Marco de datos de pandas: truncar campos de cadena

Tengo un marco de datos y me gustaría truncar cada campo hasta 20 caracteres. Intenté ingenuamente lo siguiente: df = df.astype(str).apply(lambda x: x[:20])Sin embargo, no tiene ningún efecto. Sin embargo, si quisiera agregar una 'Y' a cada ...

3 la respuesta

Marco de datos en una matriz numpy con valores separados por comas

El escenarioHe leído un csv (que está separado) en un Dataframe, que ahora necesita estar en un formato de matriz numpy para agrupar sin cambiar el tipo El problemaEn cuanto a las referencias probadas (a continuación), no pude obtener la salida ...