Resultados da pesquisa a pedido "random-forest"

0 a resposta

Scikit Learn - ValueError: Array contém NaN ou infinito

2 a resposta

A amostragem estratificada não parece alterar os resultados do randomForest

3 a resposta

Como lidar com análise ROC de múltiplas classes em R (pacote pROC)?

3 a resposta

Recuperar lista de nomes de recursos de treinamento do classificador

Existe uma maneira de recuperar a lista de nomes de recursos usados para o treinamento de um classificador, depois que ele foi treinado com ofit método? Gostaria de obter essas informações antes de aplicar a dados invisíveis. Os dados usados para ...

3 a resposta

Como lidar com recursos categóricos para Decision Tree, Random Forest em spark ml?

Estou tentando criar uma árvore de decisão e um classificador aleatório de floresta nos dados de marketing do banco UCI -> https://archive.ics.uci.edu/ml/datasets/bank+marketing [https://archive.ics.uci.edu/ml/datasets/bank+marketing]. Existem ...

1 a resposta

Como calcular o OOB da floresta aleatória?

Estou comparando alguns modelos para obter um melhor modelo. Agora, quero obter um erro OOB do modelo de floresta aleatória para compará-lo com os erros de validação cruzada de alguns outros modelos. Posso fazer a comparação? Se eu puder, como ...

2 a resposta

matplotlib: importância da plotagem com nomes de características

Em R, existem funções pré-construídas para plotar a importância das características do modelo Random Forest. Mas, em python, esse método parece estar faltando. Eu procuro um método emmatplotlib. model.feature_importances me dá o ...

1 a resposta

TypeError ao treinar Floresta Aleatória do Tensorflow usando TensorForestEstimator

Recebo um TypeError ao tentar treinar uma floresta aleatória de fluxo de tensão usando TensorForestEstimator. TypeError: Input 'input_data' of 'CountExtremelyRandomStats' Op has type float64 that does not match expected type of float32.Eu tentei ...

2 a resposta

Melhore o tempo de execução do h2o DRF em um cluster de vários nós

Atualmente estou executandoh2oO algoritmo DRF de um cluster EC2 de 3 nós (o servidor h2o abrange todos os 3 nós). Meu conjunto de dados possui 1m linhas e 41 colunas (40 preditores e 1 resposta). Eu uso oR ligações para controlar o cluster e a ...

1 a resposta

Por que a Random Forest com uma única árvore é muito melhor que um classificador da Decision Tree?

Eu aprendo o aprendizado de máquina com oscikit-learn biblioteca. Aplico o classificador da árvore de decisão e o classificador aleatório da floresta aos meus dados com este código: def decision_tree(train_X, train_Y, test_X, test_Y): clf ...