A criação de um modelo de regressão múltipla gera um erro: `Os dados do Pandas são convertidos no tipo de objeto numpy. Verifique os dados de entrada com np.asarray (data) .`

Eu tenho o dataframe de pandas com alguns preditores categóricos (ou seja, variáveis) como 0 e 1 e algumas variáveis numéricas. Quando eu encaixo isso em um stasmodel como:

est = sm.OLS(y, X).fit()

Lança:

Pandas data cast to numpy dtype of object. Check input data with np.asarray(data). 

Eu converti todos os tipos de dados do DataFrame usandodf.convert_objects(convert_numeric=True)

Após isso, todos os tipos de variáveis do quadro de dados aparecem como int32 ou int64. Mas no final ainda mostradtype: object, como isso:

4516        int32
4523        int32
4525        int32
4531        int32
4533        int32
4542        int32
4562        int32
sex         int64
race        int64
dispstd     int64
age_days    int64
dtype: object

Aqui 4516, 4523 são rótulos variáveis.

Qualquer ideia? Eu preciso criar um modelo de regressão múltipla em mais de centenas de variáveis. Para isso, concatenei três DataFrames dos pandas para criar o DataFrame final a ser usado na construção de modelos.

questionAnswers(2)

yourAnswerToTheQuestion