If type = "vector": вектор предсказанных ответов. Для деревьев регрессии это средняя реакция в узле, для деревьев Пуассона это предполагаемая скорость отклика, а для деревьев классификации это прогнозируемый класс (как число).
ольно плохо знаком с R и застрял с довольно тупой проблемой.
Я калибрую дерево регрессии, используяrpart пакет, чтобы сделать некоторую классификацию и некоторое прогнозирование.
Благодаря R калибровочную часть легко выполнять и легко контролировать.
#the package rpart is needed
library(rpart)
# Loading of a big data file used for calibration
my_data <- read.csv("my_file.csv", sep=",", header=TRUE)
# Regression tree calibration
tree <- rpart(Ratio ~ Attribute1 + Attribute2 + Attribute3 +
Attribute4 + Attribute5,
method="anova", data=my_data,
control=rpart.control(minsplit=100, cp=0.0001))
После калибровки большого дерева решений я хочу, чтобы для данной выборки данных был найден соответствующий кластер некоторых новых данных (и, следовательно, прогнозируемого значения).predict
Функция, кажется, идеально подходит для нужд.
# read validation data
validationData <-read.csv("my_sample.csv", sep=",", header=TRUE)
# search for the probability in the tree
predict <- predict(tree, newdata=validationData, class="prob")
# dump them in a file
write.table(predict, file="dump.txt")
Однако сpredict
метод я просто получить прогнозируемое соотношение моих новых элементов, и я не могу найти способ получитьлист дерева решений где мои новые элементы принадлежат.
Я думаю, что это должно быть довольно легко получить, так как метод прогнозированиядолжен нашли этот лист, чтобы вернуть соотношение.
Есть несколько параметров, которые могут быть заданы для метода прогнозирования черезclass=
аргумент, но для дерева регрессии все, кажется, возвращают одно и то же (значение целевого атрибута дерева решений)
Кто-нибудь знает, как получить соответствующий узел в дереве решений?
Анализируя узел сpath.rpart
метод, это поможет мне понять результаты.