La construcción del modelo de regresión múltiple arroja un error: `Los datos de pandas se convierten en un tipo de objeto numpy. Verifique los datos de entrada con np.asarray (datos).
Tengo un marco de datos de pandas con algunos predictores categóricos (es decir, variables) como 0 y 1, y algunas variables numéricas. Cuando ajusto eso a un modelo stas como:
est = sm.OLS(y, X).fit()
Arroja:
Pandas data cast to numpy dtype of object. Check input data with np.asarray(data).
Convertí todos los dtypes del DataFrame usandodf.convert_objects(convert_numeric=True)
Después de esto, todos los tipos de variables de trama de datos aparecen como int32 o int64. Pero al final todavía muestradtype: object
, Me gusta esto:
4516 int32
4523 int32
4525 int32
4531 int32
4533 int32
4542 int32
4562 int32
sex int64
race int64
dispstd int64
age_days int64
dtype: object
Aquí 4516, 4523 son etiquetas variables.
¿Alguna idea? Necesito construir un modelo de regresión múltiple en más de cientos de variables. Para eso, he concatenado 3 DataFrames de pandas para crear el DataFrame final que se utilizará en la construcción de modelos.