Что `sample_weight` делает с тем, как` DecisionTreeClassifier` работает в sklearn?
Я прочитал изэта документация тот :
«Балансировка классов может быть выполнена путем выборки равного числа выборок из каждого класса или, предпочтительно, путем нормализации суммы весов выборки (sample_weight) для каждого класса к одному и тому же значению».
Но мне все еще неясно, как это работает. Если я установлюsample_weight
с массивом только двух возможных значений,1
и2
это значит, что образцы с2
будет взят в два раза чаще, чем образцы с1
когда делаешь мешки? Я не могу придумать практического примера для этого.