Построение мультирегрессионной модели выдает ошибку: `Данные Pandas приводятся к объекту типа dumpy. Проверьте входные данные с помощью np.asarray (data) .`
У меня есть pandas dataframe с некоторыми категориальными предикторами (то есть переменными) как 0 & 1, и некоторыми числовыми переменными. Когда я подгоняю это к стасмодели вроде
est = sm.OLS(y, X).fit()
Это бросает:
Pandas data cast to numpy dtype of object. Check input data with np.asarray(data).
Я преобразовал все dtypes DataFrame, используяdf.convert_objects(convert_numeric=True)
После этого все dtypes переменных dataframe отображаются как int32 или int64. Но в конце это все еще показываетdtype: object
, как это:
4516 int32
4523 int32
4525 int32
4531 int32
4533 int32
4542 int32
4562 int32
sex int64
race int64
dispstd int64
age_days int64
dtype: object
Здесь 4516, 4523 являются переменными метками.
Любая идея? Мне нужно построить модель мультирегрессии на более чем сотне переменных. Для этого я объединил 3 панды DataFrames, чтобы придумать окончательный DataFrame, который будет использоваться при построении модели.