Resultados de la búsqueda a petición "pandas"
pandas to_datetime () luego concat () en DateTime Index
Estoy tratando de fusionar 2 DataFrames usandoconcat, en su Índice DateTime, pero no funciona como esperaba. Copié parte de este código del ejemplo en ...
encontrar nombres de columnas numéricas en pandas
Necesito seleccionar columnas en Pandas que contengan solo valores numéricos en los nombres de columna, por ejemplo: df= 0 1 2 3 4 window_label next_states ids 0 17.0 18.0 16.0 15.0 15.0 ddddd d 13.0 1 18.0 16.0 15.0 15.0 16.0 ddddd d 13.0 2 ...
MultiIndex / Reformulación de las diferencias entre las versiones de Pandas
Tengo un DataFrame con el siguiente código: import pandas as pd import numpy as np index = pd.DatetimeIndex(['2017-05-04', '2017-05-05', '2017-05-08', '2017-05-09', '2017-05-10'], dtype='datetime64[ns]',name = 'date', freq='B') columns ...
Cómo eliminar caracteres ilegales para que un marco de datos pueda escribir en Excel
Estoy tratando de escribir un marco de datos en una hoja de cálculo de Excel usando ExcelWriter, pero sigue apareciendo un error: openpyxl.utils.exceptions.IllegalCharacterErrorSupongo que hay algún carácter en el marco de datos que a ...
drop_duplicates no funciona en pandas?
El propósito de mi código es importar 2 archivos de Excel, compararlos e imprimir las diferencias en un nuevo archivo de Excel. Sin embargo, después de concatenar todos los datos y usar eldrop_duplicates función, el código es aceptado por la ...
Combinar dos conjuntos de datos en pandas
Anteriormente trabajé con Stata y ahora estoy tratando de hacer lo mismo con Python. Sin embargo, tengo problemas con el comando de combinación. De alguna manera debo estar perdiendo algo. Mis dos marcos de datos que quiero fusionar se ven ...
Python Pandas: encuentre un grupo consecutivo con valores agregados máximos
Tengo un marco de datos con fechas y números enteros import numpy as np import pandas as pd df = pd.DataFrame() df['dt'] = pd.date_range("2017-01-01 12:00", "2017-01-01 12:30", freq="1min") df['val'] = np.random.choice(xrange(1, 100), ...
Pandas read_csv acelerar
Estoy leyendo un csv grande que tiene alrededor de 10 millones de filas y 20 columnas diferentes (con nombres de encabezado). Tengo valores, 2 columnas con fechas y algunas cadenas. Actualmente me lleva alrededor de 1,5 minutos cargar los datos ...
Marco de datos de pandas: truncar campos de cadena
Tengo un marco de datos y me gustaría truncar cada campo hasta 20 caracteres. Intenté ingenuamente lo siguiente: df = df.astype(str).apply(lambda x: x[:20])Sin embargo, no tiene ningún efecto. Sin embargo, si quisiera agregar una 'Y' a cada ...
Marco de datos en una matriz numpy con valores separados por comas
El escenarioHe leído un csv (que está separado) en un Dataframe, que ahora necesita estar en un formato de matriz numpy para agrupar sin cambiar el tipo El problemaEn cuanto a las referencias probadas (a continuación), no pude obtener la salida ...