Resultados de la búsqueda a petición "random-forest"

2 la respuesta

Fitting sklearn modelo GridSearchCV

Estoy tratando de resolver un problema de regresión en Conjunto de datos de Boston [https://www.kaggle.com/c/boston-housing] con ayuda de regresor ...

2 la respuesta

Predict clases o probabilidades de clase?

Actualmente estoy usando H2O para un conjunto de datos de problemas de clasificación. Lo estoy probando conH2ORandomForestEstimator en un entorno python 3.6. Noté que los resultados del método de predicción daban valores entre 0 y 1 (supongo que ...

1 la respuesta

maxCategories no funciona como se esperaba en VectorIndexer cuando se usa RandomForestClassifier en pyspark.ml

Fondo: estoy haciendo una clasificación binaria simple, usando RandomForestClassifier de pyspark.ml. Antes de alimentar los datos al entrenamiento, logré usar VectorIndexer para decidir si las características serían numéricas o categóricas al ...

1 la respuesta

R: uso de guardabosques con caret, argumento tuneGrid

Estoy usando elsigno de intercalación [https://cran.r-project.org/web/packages/caret/index.html]paquete para analizar modelos de bosque aleatorio creados conguardabosque [https://cran.r-project.org/web/packages/ranger/index.html]. No puedo ...

1 la respuesta

¿Por qué Random Forest con un solo árbol es mucho mejor que un clasificador de árbol de decisión?

Aprendo el aprendizaje automático con elscikit-learn biblioteca. Aplico el clasificador de árbol de decisión y el clasificador de bosque aleatorio a mis datos con este código: def decision_tree(train_X, train_Y, test_X, test_Y): clf ...

1 la respuesta

¿Cómo calcular la OOB del bosque aleatorio?

Estoy comparando algunos modelos para obtener el mejor modelo. Ahora, quiero obtener un error OOB del modelo de bosque aleatorio para compararlo con los errores de validación cruzada de algunos otros modelos. ¿Puedo hacer la comparación? Si ...

0 la respuesta

Misma probabilidad para cada hora en un bucle con randomForest

Estoy prediciendo probabilidades por hora para cada observación con un modelo de bosque aleatorio. Pero por alguna razón, la predicción para cada hora dentro de una observación es la misma. Este no debería ser el caso, ya que la probabilidad es ...

2 la respuesta

Cómo usar variables de cadena en VectorAssembler en Pyspark

Quiero ejecutar el algoritmo Random Forests en Pyspark. Se menciona en el Documentación de Pyspark [http://spark.apache.org/docs/latest/ml-features.html#vectorassembler]que VectorAssembler acepta solo tipos de datos numéricos o booleanos. ...

2 la respuesta

Mejore el tiempo de ejecución de h2o DRF en un clúster de múltiples nodos

Actualmente estoy corriendoh2oEl algoritmo DRF es un clúster EC2 de 3 nodos (el servidor h2o abarca los 3 nodos). Mi conjunto de datos tiene 1 millón de filas y 41 columnas (40 predictores y 1 respuesta). Yo uso elR enlaces para controlar el ...

1 la respuesta

TypeError al entrenar Tensorflow Random Forest usando TensorForestEstimator

Me sale un error de tipo cuando intento entrenar un bosque aleatorio de Tensorflow usando TensorForestEstimator. TypeError: Input 'input_data' of 'CountExtremelyRandomStats' Op has type float64 that does not match expected type of float32.He ...