Resultados da pesquisa a pedido "random-forest"
maxCategories não está funcionando como esperado no VectorIndexer ao usar RandomForestClassifier no pyspark.ml
Antecedentes: estou fazendo uma classificação binária simples, usando RandomForestClassifier do pyspark.ml. Antes de alimentar os dados para o treinamento, consegui usar o VectorIndexer para decidir se os recursos seriam numéricos ou categóricos, ...
Por que a Random Forest com uma única árvore é muito melhor que um classificador da Decision Tree?
Eu aprendo o aprendizado de máquina com oscikit-learn biblioteca. Aplico o classificador da árvore de decisão e o classificador aleatório da floresta aos meus dados com este código: def decision_tree(train_X, train_Y, test_X, test_Y): clf ...
O que o `sample_weight` faz com a maneira como um` DecisionTreeClassifier` funciona no sklearn?
Eu li deesta documentação [http://scikit-learn.org/stable/modules/tree.html#classification]que : "O balanceamento de classe pode ser feito amostrando um número igual de amostras de cada classe, ou preferencialmente normalizando a soma dos pesos ...
Qual é a diferença entre cross_val_score com scoring = 'roc_auc' e roc_auc_score?
Estou confuso sobre a diferença entre a métrica de pontuação cross_val_score 'roc_auc' e a roc_auc_score que posso importar e ligar diretamente. A documentação ...
Resultados diferentes com fórmula e sem fórmula para treinamento em acento circunflexo
Notei que o uso de métodos de fórmula e não-fórmula em acento circunflexo durante o treinamento produz resultados diferentes. Além disso, o tempo necessário para o método de fórmula é quase 10x o tempo gasto para o método de não fórmula. Isso é ...
Fitting sklearn Modelo GridSearchCV
Estou tentando resolver um problema de regressão emBoston Dataset [https://www.kaggle.com/c/boston-housing] com a ajuda derandom regressor florestal [https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestRegressor.html] ...
Gráfico de importância de recursos aleatórios da floresta usando Python
Estou trabalhando com o RandomForestRegressor em python e quero criar um gráfico que ilustre a classificação da importância do recurso. Este é o código que eu usei: from sklearn.ensemble import RandomForestRegressor ...
Preciso normalizar (ou dimensionar) dados para randomForest (pacote R
Estou realizando uma tarefa de regressão - preciso normalizar (ou dimensionar) dados para randomForest (pacote R)? E é necessário dimensionar também os valores-alvo? E se - eu quero usar a função de escala do pacote de sinal de intercalação, mas ...
O que significa% IncMSE negativo no pacote RandomForest?
Eu usei o RandomForest para um problema de regressão. eu useiimportance(rf,type=1) para obter o% IncMSE para as variáveis e uma delas tem um% IncMSE negativo. Isso significa que essa variável é ruim para o modelo? Pesquisei na Internet para obter ...