Resultados de la búsqueda a petición "pandas"

2 la respuesta

python panda: devuelve índices de filas comunes

Disculpas, si esta es una pregunta bastante nueva. Estaba tratando de encontrar qué filas son comunes entre dos marcos de datos. Los valores de retorno deben ser los índices de fila de df2 que son comunes con df1. Mi ejemplo torpe: df1 = ...

1 la respuesta

pandas to_excel () ignora / permite nombres de columna duplicados

¿Hay alguna forma de ignorar los nombres de columna duplicados después de usar la función to_excel () de los pandas? Di, tengo old_wb.xlsx: >> df1 = pd.read_excel('wb1.xlsx') ---------------------merged header-------------------- col1 col2 ...

4 la respuesta

computing the mean for python datetime

Tengo un atributo de fecha y hora: d = { 'DOB': pd.Series([ datetime.datetime(2014, 7, 9), datetime.datetime(2014, 7, 15), np.datetime64('NaT') ], index=['a', 'b', 'c']) } df_test = pd.DataFrame(d) Me gustaría calcular la media de ese atributo. ...

1 la respuesta

Pandas agrega una columna con un valor basado en la condición basada en otras columnas

Tengo el siguiente marco de datos de pandas: [/imgs/zMiCD.png] import pandas as pd import numpy as np d = {'age' : [21, 45, 45, 5], 'salary' : [20, 40, 10, 100]} df = pd.DataFrame(d) y le gustaría agregar una columna adicional llamada ...

1 la respuesta

¿Cómo lidiar con la imputación y la codificación hot one en pandas?

Estoy tratando de aplicar tanto la imputación como la codificación hot one en mi conjunto de datos. Sé que al aplicar la imputación, la dimensión de los datos puede cambiar y, por lo tanto, me ocupé de ello manualmente. El modelo funcionaba ...

1 la respuesta

Prueba de autocorrelación en varias devoluciones de stock

Me gustaría realizar una prueba de autocorrelación (por ejemplo, Durbin Watson) en un conjunto de datos de devoluciones de acciones. En particular, tengo un conjunto de datos con rendimientos trimestrales de acciones, así que 1 observación para ...

3 la respuesta

Eliminación de puntuación rápida con pandas

Esta es una publicación con respuesta propia. A continuación, describo un problema común en el dominio de PNL y propongo algunos métodos eficaces para resolverlo. veces surge la necesidad de eliminarpuntuació durante la limpieza del texto y el ...

1 la respuesta

Cómo convertir un formato de fecha y hora a minutos - pandas

Tengo un marco de datos que tiene una columna use_duration (que es la diferencia de otras dos columnas en formato de fecha y hora). Se ve a continuación: processid, userid, usage_duration 17613,root,0 days 23:41:03.000000000 17641,root,2 days ...

1 la respuesta

¿Por qué la identificación de una celda de marco de datos de pandas cambia con cada ejecución?

e encontré con este problema cuando intentaba asegurarme de algunas propiedades de la vista del marco de datos. Supongamos que tengo un marco de datos definido como:df = pd.DataFrame(columns=list('abc'), data=np.arange(18).reshape(6, 3)) y una ...

1 la respuesta

Leyenda de diagrama de dispersión multicolor en Python

Tengo algunos datos básicos sobre el tamaño del motor del automóvil, la potencia y el tipo de carrocería (muestra a continuación) body-style engine-size horsepower 0 convertible 130 111.0 2 hatchback 152 154.0 3 sedan 109 102.0 7 wagon 136 110.0 ...