rpart - Encuentra el número de hojas que devolvería un valor de cp para podar un árbol

Tengo un requisito en el que necesito agrupar mis variables categóricas (que tienen más de 5 valores de categoría) en 5 grupos según su asociación con mi variable continua. Para lograr esto estoy usandorpart con "annova"método.

Entonces, por ejemplo, mi variable categórica estipo tener códigos1,2,3,4,5,6,7,8,9,10,11,12,13,14,15 entonces quiero tener 5 grupos de esta variable. Después de ejecutar el árbol para tener solo 5 grupos, necesito podar el árbol. Una forma que probé es usar elnsplit decptable pero, nsplit de 5 podría darme 7-8 hojas y de manera similarnsplit de 4 podría darme 5-6 hojas.

Estaba buscando una opción por la cual cuando podo solo obtengo 5 hojas que actuarían como mis 5 grupos.

¿Puede alguien sugerirme cómo puedo lograr esto usando rpart?

Gracias !!

Respuestas a la pregunta(0)

Su respuesta a la pregunta