Как бороться с отсутствующими значениями атрибутов в дереве решений C4.5 (J48)?

Какие'лучший способ справиться с отсутствующими значениями атрибутов объектов с помощью WekaS C4.5 (J48) дерево решений? Проблема пропущенных значений возникает во время обучения и классификации.

Если значения отсутствуют в обучающих экземплярах, правильно ли я полагаю, что ставлю «?» значение для функции?

Предположим, что я могу успешно построить дерево решений, а затем создать свой собственный код дерева в C ++ или Java из Weka.древовидная структура. Во время классификации, если я пытаюсь классифицировать новый экземпляр, какое значение я должен придать объектам, у которых отсутствуют значения? Как бы я спустил дерево за узлом принятия решения, для которого у меня есть неизвестное значение?

Будет ли лучше использовать Наивный Байес для обработки пропущенных значений? Я бы просто назначил им очень малую ненулевую вероятность, верно?

Ответы на вопрос(2)

Ваш ответ на вопрос