Cómo ingresar datos a H2O rápidamente

Lo que mi pregunta no es:

Manera eficiente de mantener un marco de datos H2OH2O funciona más lento que data.table RCargando datos más grandes que el tamaño de la memoria en H2O

Hardware / espacio:

32 hilos Xeon con ~ 256 GB de RAM~ 65 GB de datos para cargar. (alrededor de 5.6 billones de células)

Problema:
Me lleva horas cargar mis datos en H2O. Este no es un procesamiento especial, solo "as.h2o (...)".

Toma menos de un minuto usar "fread" para obtener el texto en el espacio y luego hago algunas transformaciones de fila / columna (diferencias, retrasos) e intento importar.

La memoria R total es de ~ 56 GB antes de intentar cualquier tipo de "as.h2o", por lo que el 128 asignado no debería ser demasiado loco, ¿verdad?

Pregunta:
¿Qué puedo hacer para que esto tarde menos de una hora en cargarse en H2O? Debería tomar de un minuto a unos minutos, ya no.

Lo que he intentado:

RAM de hasta 128 GB en 'h2o.init'usando slam, data.table y opciones (...convertir a "as.data.frame" antes de "as.h2o"escribir en un archivo csv (r write.csv se ahoga y tarda una eternidad. Sin embargo, está escribiendo una gran cantidad de GB, por lo que entiendo).escribe en sqlite3, demasiadas columnas para una tabla, lo cual es extraño.Se revisó la memoria caché / intercambio de unidades para asegurarse de que haya suficientes GB allí. Quizás Java está usando caché. (aún trabajando)

Actualizar:
Parece que mi única opción es hacer un archivo de texto gigante y luego usar "h2o.importFile (...)" para ello. Estoy escrito hasta 15GB.

Actualización2:
Es un archivo csv horrible, a ~ 22GB (~ 2.4Mrows, ~ 2300 cols). Para lo que valió, tomó desde las 12:53 pm hasta las 2:44 pm para escribir el archivo csv. Importarlo fue sustancialmente más rápido, después de que se escribió.

Respuestas a la pregunta(1)

Su respuesta a la pregunta