Точная реализация RandomForest в Weka 3.7
Изучив первоначальный документ Бреймана (2001), а также некоторые другие посты совета директоров, я немного запутался в фактической процедуре, используемой в реализации случайных лесов WEKA. Ни один из источников не был достаточно сложным, многие даже противоречили друг другу.
Как это работает в деталях, какие шаги выполняются?
Мое понимание до сих пор:
Для каждого дерева создается образец начальной загрузки того же размера, что и тренировочные данные.Только случайное подмножество доступных функций определенного размера (параметр может быть выбран в WEKA) рассматривается для каждого узлаЧто касается используемого ученика базового дерева, то я обнаружил, что в 2006 году было написано, что это измененное дерево REPTree.Дерево полностью выросло и не обрезается.Применяется большинство голосов (в случае точности в качестве показателя эффективности)Мои вопросы:
Используется ли на самом деле начальная выборка?REPTree все еще используется или алгоритм был изменен с тех пор?Разъяснение этих вопросов мне очень поможет!