Resultados de la búsqueda a petición "h2o"
Por qué está terminando la conexión
Estoy probando un modelo de clasificación de bosque aleatorio usandoH2O biblioteca dentro de R en un conjunto de entrenamiento que tiene 70 millones de filas y 25 características numéricas. El tamaño total del archivo es de 5.6 GB. El tamaño del ...
R: Trazar árboles de h2o.randomForest () y h2o.gbm ()
Buscando una manera eficiente de trazar árboles en rstudio, H2O's Flow o en la página html local de los modelos RF y GBM de h2o similares a los de la imagen en el enlace a continuación.Específicamente, ¿cómo traza los árboles para los objetos ...
Cómo comprender las métricas del objeto H2OModelMetrics a través de h2o.performance
Después de crear el modelo usandoh2o.randomForest, luego usando: perf <- h2o.performance(model, test) print(perf)Recibo la siguiente información (valorH2OModelMetrics objeto) H2OBinomialMetrics: drf MSE: 0.1353948 RMSE: 0.3679604 LogLoss: ...
H2O R api: recuperando el modelo óptimo de la búsqueda de cuadrícula
Estoy usando elh2o paquete (v 3.6.0) en R, y he construido un modelo de búsqueda de cuadrícula. Ahora, estoy tratando de acceder al modelo que minimiza MSE en el conjunto de validación. En pitónsklearn, esto se puede lograr fácilmente cuando se ...
La forma más rápida de leer en 100,000 archivos .dat.gz
Tengo unos pocos cientos de miles muy pequeños.dat.gz archivos que quiero leer en R de la manera más eficiente posible. Leí el archivo e inmediatamente agregué y descarté los datos, por lo que no me preocupa administrar la memoria a medida que me ...
Mejore el tiempo de ejecución de h2o DRF en un clúster de múltiples nodos
Actualmente estoy corriendoh2oEl algoritmo DRF es un clúster EC2 de 3 nodos (el servidor h2o abarca los 3 nodos). Mi conjunto de datos tiene 1 millón de filas y 41 columnas (40 predictores y 1 respuesta). Yo uso elR enlaces para controlar el ...
Cree un mapa para llamar al POJO para cada fila de Spark Dataframe
Construí un modelo H2O en R y guardé el código POJO. Quiero puntuar archivos de parquet en hdfs usando el POJO pero no estoy seguro de cómo hacerlo. Planeo leer los archivos de parquet en chispa (scala / SparkR / PySpark) y marcarlos allí. ...
Error con H2O en R: no se puede conectar al host local
No puedo hacer que el H2O funcione en mi R. Muestra el siguiente error. No tengo idea de lo que significa. Anteriormente me dio un error porque no tenía la versión Java de 64 bits. Descargué el 64bit, reinicié mi PC, comencé el proceso nuevamente ...
Cómo ingresar datos a H2O rápidamente
Lo que mi pregunta no es: Manera eficiente de mantener un marco de datos H2O [https://stackoverflow.com/questions/44683514/efficient-way-to-maintain-a-h2o-data-frame] H2O funciona más lento que data.table ...
Distancia euclídea incorrecta Cálculos de H2O R
Estoy usando H2O con R para calcular la distancia euclidiana entre 2 data.frames: set.seed(121) #create the data df1<-data.frame(matrix(rnorm(1000),ncol=10)) df2<-data.frame(matrix(rnorm(300),ncol=10)) #init h2o h2o.init() #transform to h2o ...