Как прогнозировать новый набор данных с помощью пакета caretEnsemble в R?
Я сейчас пользуюсьcaretEnsemble
Пакет в R для объединения нескольких моделей, обученных в карете. У меня есть список финальных обученных моделей (скажем,model_list
) с помощьюcaretList
Функция из того же пакета следующим образом.
model_list <- caretList(
x = input_predictors,
y = input_labels,
metric = 'Accuracy',
tuneList = list(
randomForestModel = caretModelSpec(method='rf',
tuneLength=1,
preProcess=c('BoxCox', 'center', 'scale')),
ldaModel = caretModelSpec(method='lda',
tuneLength=1,
preProcess=c('BoxCox', 'center', 'scale')),
logisticRegressionModel = caretModelSpec(method='glm',
tuneLength=1,
preProcess=c('BoxCox', 'center', 'scale'))
),
trControl = myTrainControl
)
Объект управления поездом, который я предоставил, был следующим:
myTrainControl = trainControl(method = "cv",
number = 10,
index=createResample(training_input_data$retinopathy, 10),
savePredictions = TRUE,
classProbs = TRUE,
verboseIter = TRUE,
summaryFunction = twoClassSummary)
Сейчас я тренируюсь в списке моделей:
ens <- caretEnsemble(model_list)
применениеsummary
наens
говорит мне выбранные модели (изmodel_list
), вес, выделенный для этих выбранных моделей, вне образцаAUC
значения для каждой из выбранных моделей и, наконец, в выборкеAUC
значения дляens
.
Теперь я хочу вычислить производительностьens
на других тестовых данных (чтобы получить представление о производительности вне выборки). Как бы я этого достиг?
Я пробую это как:
ensPredictions <- predict(ens, newdata = test_data)
но это дает мне ошибку как:
Error in `[.data.frame`(out, , obsLevels, drop = FALSE) :
undefined columns selected