Ajuda para entender a validação cruzada e as árvores de decisão

Estive lendo sobre árvores de decisão e validação cruzada e entendo os dois conceitos. No entanto, estou tendo problemas para entender a Validação Cruzada no que diz respeito às Árvores de Decisão. Essencialmente, a Validação Cruzada permite alternar entre treinamento e teste quando o conjunto de dados é relativamente pequeno para maximizar sua estimativa de erro. Um algoritmo muito simples é mais ou menos assim:

Decida o número de dobras que deseja (k)Subdividir seu conjunto de dados em k dobrasUse dobras k-1 para um conjunto de treinamento para construir uma árvore.Use o conjunto de testes para estimar estatísticas sobre o erro em sua árvore.Salve seus resultados para mais tardeRepita as etapas 3 a 6 por k vezes, deixando uma dobra diferente para o seu conjunto de testes.Faça a média dos erros nas suas iterações para prever o erro geral

O problema que não consigo descobrir é que, no final, você terá k Árvores de decisão que podem ser um pouco diferentes porque podem não se dividir da mesma maneira etc. Que árvore você escolhe? Uma ideia que tive foi escolher a que apresentasse erros mínimos (embora isso não a torne ideal, apenas que teve o melhor desempenho na dobra que foi dada - talvez usar estratificação ajude, mas tudo o que li diz que ajuda apenas um pouco )

Pelo que entendi a validação cruzada, o objetivo é calcular nas estatísticas do nó que mais tarde podem ser usadas para remoção. Então, realmente, cada nó da árvore terá estatísticas calculadas para ele com base no conjunto de testes fornecido a ele. O que é importante são estas nas estatísticas do nó, mas se você estiver calculando a média do seu erro. Como você mescla essas estatísticas em cada nó entre k árvores, quando cada árvore pode variar no que elas escolhem dividir etc.

Qual é o sentido de calcular o erro geral em cada iteração? Isso não é algo que possa ser usado durante a poda.

Qualquer ajuda com esta pequena ruga seria muito apreciada.

questionAnswers(5)

yourAnswerToTheQuestion