Dokładne wdrożenie RandomForest w Weka 3.7

Po zapoznaniu się z oryginalnym artykułem Breimana (2001), a także z innymi postami na forum, jestem nieco pomylony z faktyczną procedurą stosowaną przez losową implementację lasu WEKA. Żadne ze źródeł nie było wystarczająco skomplikowane, wiele nawet się ze sobą sprzeczało.

Jak to działa szczegółowo, jakie kroki są wykonywane?

Moje zrozumienie do teraz:

Dla każdego drzewa tworzona jest próbka bootstrapu tego samego rozmiaru co dane treningoweTylko losowy podzbiór dostępnych funkcji o określonym rozmiarze (parametr można wybrać w WEKA) jest brany pod uwagę dla każdego węzłaJeśli chodzi o bazowego ucznia, którego użyłem, znalazłem, że post z 2006 r. Był zmodyfikowany REPTree.Drzewo jest w pełni wyrośnięte i nie przycinane.Głos większości jest stosowany (w przypadku dokładności jako miara wydajności)

Moje pytania:

Czy próbkowanie bootstrapu jest rzeczywiście używane?Czy REPTree jest nadal w użyciu lub czy algorytm został zmieniony od tego czasu?

Wyjaśnienie tych kwestii bardzo by mi pomogło!

questionAnswers(1)

yourAnswerToTheQuestion