Resultados de la búsqueda a petición "h2o"

2 la respuesta

Por qué está terminando la conexión

Estoy probando un modelo de clasificación de bosque aleatorio usandoH2O biblioteca dentro de R en un conjunto de entrenamiento que tiene 70 millones de filas y 25 características numéricas. El tamaño total del archivo es de 5.6 GB. El tamaño del ...

2 la respuesta

R: Trazar árboles de h2o.randomForest () y h2o.gbm ()

Buscando una manera eficiente de trazar árboles en rstudio, H2O's Flow o en la página html local de los modelos RF y GBM de h2o similares a los de la imagen en el enlace a continuación.Específicamente, ¿cómo traza los árboles para los objetos ...

2 la respuesta

Cómo comprender las métricas del objeto H2OModelMetrics a través de h2o.performance

Después de crear el modelo usandoh2o.randomForest, luego usando: perf <- h2o.performance(model, test) print(perf)Recibo la siguiente información (valorH2OModelMetrics objeto) H2OBinomialMetrics: drf MSE: 0.1353948 RMSE: 0.3679604 LogLoss: ...

3 la respuesta

H2O R api: recuperando el modelo óptimo de la búsqueda de cuadrícula

Estoy usando elh2o paquete (v 3.6.0) en R, y he construido un modelo de búsqueda de cuadrícula. Ahora, estoy tratando de acceder al modelo que minimiza MSE en el conjunto de validación. En pitónsklearn, esto se puede lograr fácilmente cuando se ...

3 la respuesta

La forma más rápida de leer en 100,000 archivos .dat.gz

Tengo unos pocos cientos de miles muy pequeños.dat.gz archivos que quiero leer en R de la manera más eficiente posible. Leí el archivo e inmediatamente agregué y descarté los datos, por lo que no me preocupa administrar la memoria a medida que me ...

2 la respuesta

Mejore el tiempo de ejecución de h2o DRF en un clúster de múltiples nodos

Actualmente estoy corriendoh2oEl algoritmo DRF es un clúster EC2 de 3 nodos (el servidor h2o abarca los 3 nodos). Mi conjunto de datos tiene 1 millón de filas y 41 columnas (40 predictores y 1 respuesta). Yo uso elR enlaces para controlar el ...

2 la respuesta

Cree un mapa para llamar al POJO para cada fila de Spark Dataframe

Construí un modelo H2O en R y guardé el código POJO. Quiero puntuar archivos de parquet en hdfs usando el POJO pero no estoy seguro de cómo hacerlo. Planeo leer los archivos de parquet en chispa (scala / SparkR / PySpark) y marcarlos allí. ...

2 la respuesta

Error con H2O en R: no se puede conectar al host local

No puedo hacer que el H2O funcione en mi R. Muestra el siguiente error. No tengo idea de lo que significa. Anteriormente me dio un error porque no tenía la versión Java de 64 bits. Descargué el 64bit, reinicié mi PC, comencé el proceso nuevamente ...

1 la respuesta

Cómo ingresar datos a H2O rápidamente

Lo que mi pregunta no es: Manera eficiente de mantener un marco de datos H2O [https://stackoverflow.com/questions/44683514/efficient-way-to-maintain-a-h2o-data-frame] H2O funciona más lento que data.table ...

1 la respuesta

Distancia euclídea incorrecta Cálculos de H2O R

Estoy usando H2O con R para calcular la distancia euclidiana entre 2 data.frames: set.seed(121) #create the data df1<-data.frame(matrix(rnorm(1000),ncol=10)) df2<-data.frame(matrix(rnorm(300),ncol=10)) #init h2o h2o.init() #transform to h2o ...