Building Multi-Regressionsmodell löst Fehler aus: `Pandas-Daten werden in numpy dtype des Objekts umgewandelt. Überprüfen Sie die Eingabedaten mit np.asarray (data) .`
Ich habe Pandas-Datenrahmen mit einigen kategorialen Prädiktoren (d. H. Variablen) als 0 & 1 und einigen numerischen Variablen. Wenn ich das zu einem stasmodel wie passe:
est = sm.OLS(y, X).fit()
It wirft:
Pandas data cast to numpy dtype of object. Check input data with np.asarray(data).
Ich habe alle D-Typen des DataFrames mit @ konvertierdf.convert_objects(convert_numeric=True)
Danach werden alle Datentypen von Datenrahmenvariablen als int32 oder int64 angezeigt. Aber am Ende zeigt es nochdtype: object
, so was
4516 int32
4523 int32
4525 int32
4531 int32
4533 int32
4542 int32
4562 int32
sex int64
race int64
dispstd int64
age_days int64
dtype: object
Hier 4516, 4523 sind variable Beschriftungen.
Irgendeine Idee? Ich muss ein Multi-Regressionsmodell auf mehr als Hunderten von Variablen aufbauen. Dafür habe ich 3 Pandas-DataFrames verkettet, um den endgültigen DataFrame für den Modellbau zu erstellen.