Добавление statsmodels 'предсказывают' результаты в фрейм данных Pandas
Распространено желание добавлять результаты прогнозов в набор данных, используемый для прогнозов, но в statsmodelspredict
функция возвращает (не проиндексированные) результаты потенциально другой длины, чем набор данных, на котором основаны прогнозы.
Например, если тестовый набор данных,test
, содержит любые нулевые записи, затем
mod_fit = sm.Logit.from_formula('Y ~ A B C', train).fit()
press = mod_fit.predict(test)
будет производить массив, который короче, чем длинаtest
и не может быть добавлен
test['preds'] = preds
И так как результатpredict
не индексируется, нет способа восстановить строки, к которым должны быть прикреплены результаты.
Что такое идиома для общенияpredict
результаты строк, из которых они были сгенерированы? Есть, возможно, способ получитьpredict
вернуть фрейм данных, который сохраняет индексы своего аргумента?