Вы вычислите расстояние между вашими точками на основе числовой переменной, а затем срежете дерево, чтобы получить 5 групп.

я есть требование, когда мне нужно сгруппировать мои категориальные переменные (имеющие более 5 значений категории) в 5 групп на основе их связи с моей непрерывной переменной. Для достижения этого я используюrpart с участием "annovaметод.

Так, например, моя категориальная переменнаятип имея коды1,2,3,4,5,6,7,8,9,10,11,12,13,14,15 поэтому я хочу иметь 5 групп этой переменной. После запуска дерева порядка, чтобы иметь только 5 групп, мне нужно обрезать дерево. Один из способов, которыми я пытался это использоватьnsplit изcptable но nsplit из 5 может дать мне 7-8 листьев и аналогичноnsplit из 4 может дать мне 5-6 листьев.

Я искал вариант, по которому, когда я подрежаю, я получаю только 5 листьев, которые будут действовать как мои 5 групп.

Может кто-нибудь подсказать, пожалуйста, как я могу добиться этого с помощью rpart.

Спасибо !!

Ответы на вопрос(0)

Ваш ответ на вопрос