Resultados de la búsqueda a petición "pandas"
python panda: devuelve índices de filas comunes
Disculpas, si esta es una pregunta bastante nueva. Estaba tratando de encontrar qué filas son comunes entre dos marcos de datos. Los valores de retorno deben ser los índices de fila de df2 que son comunes con df1. Mi ejemplo torpe: df1 = ...
pandas to_excel () ignora / permite nombres de columna duplicados
¿Hay alguna forma de ignorar los nombres de columna duplicados después de usar la función to_excel () de los pandas? Di, tengo old_wb.xlsx: >> df1 = pd.read_excel('wb1.xlsx') ---------------------merged header-------------------- col1 col2 ...
computing the mean for python datetime
Tengo un atributo de fecha y hora: d = { 'DOB': pd.Series([ datetime.datetime(2014, 7, 9), datetime.datetime(2014, 7, 15), np.datetime64('NaT') ], index=['a', 'b', 'c']) } df_test = pd.DataFrame(d) Me gustaría calcular la media de ese atributo. ...
Pandas agrega una columna con un valor basado en la condición basada en otras columnas
Tengo el siguiente marco de datos de pandas: [/imgs/zMiCD.png] import pandas as pd import numpy as np d = {'age' : [21, 45, 45, 5], 'salary' : [20, 40, 10, 100]} df = pd.DataFrame(d) y le gustaría agregar una columna adicional llamada ...
¿Cómo lidiar con la imputación y la codificación hot one en pandas?
Estoy tratando de aplicar tanto la imputación como la codificación hot one en mi conjunto de datos. Sé que al aplicar la imputación, la dimensión de los datos puede cambiar y, por lo tanto, me ocupé de ello manualmente. El modelo funcionaba ...
Prueba de autocorrelación en varias devoluciones de stock
Me gustaría realizar una prueba de autocorrelación (por ejemplo, Durbin Watson) en un conjunto de datos de devoluciones de acciones. En particular, tengo un conjunto de datos con rendimientos trimestrales de acciones, así que 1 observación para ...
Eliminación de puntuación rápida con pandas
Esta es una publicación con respuesta propia. A continuación, describo un problema común en el dominio de PNL y propongo algunos métodos eficaces para resolverlo. veces surge la necesidad de eliminarpuntuació durante la limpieza del texto y el ...
Cómo convertir un formato de fecha y hora a minutos - pandas
Tengo un marco de datos que tiene una columna use_duration (que es la diferencia de otras dos columnas en formato de fecha y hora). Se ve a continuación: processid, userid, usage_duration 17613,root,0 days 23:41:03.000000000 17641,root,2 days ...
¿Por qué la identificación de una celda de marco de datos de pandas cambia con cada ejecución?
e encontré con este problema cuando intentaba asegurarme de algunas propiedades de la vista del marco de datos. Supongamos que tengo un marco de datos definido como:df = pd.DataFrame(columns=list('abc'), data=np.arange(18).reshape(6, 3)) y una ...
Leyenda de diagrama de dispersión multicolor en Python
Tengo algunos datos básicos sobre el tamaño del motor del automóvil, la potencia y el tipo de carrocería (muestra a continuación) body-style engine-size horsepower 0 convertible 130 111.0 2 hatchback 152 154.0 3 sedan 109 102.0 7 wagon 136 110.0 ...