A criação de um modelo de regressão múltipla gera um erro: `Os dados do Pandas são convertidos no tipo de objeto numpy. Verifique os dados de entrada com np.asarray (data) .`
Eu tenho o dataframe de pandas com alguns preditores categóricos (ou seja, variáveis) como 0 e 1 e algumas variáveis numéricas. Quando eu encaixo isso em um stasmodel como:
est = sm.OLS(y, X).fit()
Lança:
Pandas data cast to numpy dtype of object. Check input data with np.asarray(data).
Eu converti todos os tipos de dados do DataFrame usandodf.convert_objects(convert_numeric=True)
Após isso, todos os tipos de variáveis do quadro de dados aparecem como int32 ou int64. Mas no final ainda mostradtype: object
, como isso:
4516 int32
4523 int32
4525 int32
4531 int32
4533 int32
4542 int32
4562 int32
sex int64
race int64
dispstd int64
age_days int64
dtype: object
Aqui 4516, 4523 são rótulos variáveis.
Qualquer ideia? Eu preciso criar um modelo de regressão múltipla em mais de centenas de variáveis. Para isso, concatenei três DataFrames dos pandas para criar o DataFrame final a ser usado na construção de modelos.