Wie man die Beobachtungen zählt, die in jeden Knoten eines Baumes fallen

Question

Dec 03, 2012, 08:23 PM

Wie man die Beobachtungen zählt, die in jeden Knoten eines Baumes fallen

Ich beschäftige mich derzeit mit Weindaten im MMST-Paket. Ich habe den gesamten Datensatz in Training und Test aufgeteilt und einen Baum wie den folgenden Code erstellt:

library("rpart")
library("gbm")
library("randomForest")
library("MMST")

data(wine)
aux <- c(1:178)
train_indis <- sample(aux, 142, replace = FALSE)
test_indis <- setdiff(aux, train_indis)

train <- wine[train_indis,]
test <- wine[test_indis,]    #### divide the dataset into trainning and testing

model.control <- rpart.control(minsplit = 5, xval = 10, cp = 0)
fit_wine <- rpart(class ~ MalicAcid + Ash + AlcAsh + Mg + Phenols + Proa + Color + Hue + OD + Proline, data = train, method = "class", control = model.control)

windows()
plot(fit_wine,branch = 0.5, uniform = T, compress = T,  main = "Full Tree: without pruning")
text(fit_wine, use.n = T, all = T, cex = .6)

Und ich könnte so ein Bild bekommen:

Was bedeutet die Nummer unter jedem Knoten (zum Beispiel 0/1/48 unter Grignolino)? Wenn ich wissen möchte, wie viele Trainings- und Testbeispiele in jeden Knoten fallen, was soll ich in die Codes schreiben?