Resultados de la búsqueda a petición "random-forest"
Fitting sklearn modelo GridSearchCV
Estoy tratando de resolver un problema de regresión en Conjunto de datos de Boston [https://www.kaggle.com/c/boston-housing] con ayuda de regresor ...
Predict clases o probabilidades de clase?
Actualmente estoy usando H2O para un conjunto de datos de problemas de clasificación. Lo estoy probando conH2ORandomForestEstimator en un entorno python 3.6. Noté que los resultados del método de predicción daban valores entre 0 y 1 (supongo que ...
maxCategories no funciona como se esperaba en VectorIndexer cuando se usa RandomForestClassifier en pyspark.ml
Fondo: estoy haciendo una clasificación binaria simple, usando RandomForestClassifier de pyspark.ml. Antes de alimentar los datos al entrenamiento, logré usar VectorIndexer para decidir si las características serían numéricas o categóricas al ...
R: uso de guardabosques con caret, argumento tuneGrid
Estoy usando elsigno de intercalación [https://cran.r-project.org/web/packages/caret/index.html]paquete para analizar modelos de bosque aleatorio creados conguardabosque [https://cran.r-project.org/web/packages/ranger/index.html]. No puedo ...
¿Por qué Random Forest con un solo árbol es mucho mejor que un clasificador de árbol de decisión?
Aprendo el aprendizaje automático con elscikit-learn biblioteca. Aplico el clasificador de árbol de decisión y el clasificador de bosque aleatorio a mis datos con este código: def decision_tree(train_X, train_Y, test_X, test_Y): clf ...
¿Cómo calcular la OOB del bosque aleatorio?
Estoy comparando algunos modelos para obtener el mejor modelo. Ahora, quiero obtener un error OOB del modelo de bosque aleatorio para compararlo con los errores de validación cruzada de algunos otros modelos. ¿Puedo hacer la comparación? Si ...
Misma probabilidad para cada hora en un bucle con randomForest
Estoy prediciendo probabilidades por hora para cada observación con un modelo de bosque aleatorio. Pero por alguna razón, la predicción para cada hora dentro de una observación es la misma. Este no debería ser el caso, ya que la probabilidad es ...
Cómo usar variables de cadena en VectorAssembler en Pyspark
Quiero ejecutar el algoritmo Random Forests en Pyspark. Se menciona en el Documentación de Pyspark [http://spark.apache.org/docs/latest/ml-features.html#vectorassembler]que VectorAssembler acepta solo tipos de datos numéricos o booleanos. ...
Mejore el tiempo de ejecución de h2o DRF en un clúster de múltiples nodos
Actualmente estoy corriendoh2oEl algoritmo DRF es un clúster EC2 de 3 nodos (el servidor h2o abarca los 3 nodos). Mi conjunto de datos tiene 1 millón de filas y 41 columnas (40 predictores y 1 respuesta). Yo uso elR enlaces para controlar el ...
TypeError al entrenar Tensorflow Random Forest usando TensorForestEstimator
Me sale un error de tipo cuando intento entrenar un bosque aleatorio de Tensorflow usando TensorForestEstimator. TypeError: Input 'input_data' of 'CountExtremelyRandomStats' Op has type float64 that does not match expected type of float32.He ...