Formato de almacenamiento en HDFS

¿Cómo HDFS almacena los datos?

Quiero almacenar archivos de gran tamaño de una manera comprimida.

Por ejemplo, tengo un archivo de 1.5 GB, con un factor de replicación predeterminado de 3.

Requiere (1.5) * 3 = 4.5 GB de espacio.

Creo que actualmente no tiene lugar una compresión implícita de datos.

¿Existe una técnica para comprimir el archivo y almacenarlo en HDFS para ahorrar espacio en el disco?

Respuestas a la pregunta(4)

Su respuesta a la pregunta