Obteniendo "No queda espacio en el dispositivo" durante aprox. 10 GB de datos en EMR m1.large instancias

Aparece un error "No queda espacio en el dispositivo" cuando ejecuto mis trabajos de Amazon EMR utilizando m1.large como el tipo de instancia para las instancias de hadoop que se creará mediante el flujo de trabajo. El trabajo genera aprox. 10 GB de datos al máximo y dado que la capacidad de una instancia m1.large se supone que es de 420 GB * 2 (según:Tipos de instancia EC2 ). Estoy confundido de que solo 10 GB de datos podrían llevar a una clase de mensaje de "espacio en disco lleno". Soy consciente de la posibilidad de que también se pueda generar este tipo de error si hemos agotado por completo el número total de inodos permitidos en el sistema de archivos, pero es como un gran número que asciende a millones y estoy bastante seguro de que mi trabajo no es produciendo tantos archivos. He visto que cuando intento crear una instancia de EC2 independientemente de m1.large, se le asigna por defecto un volumen raíz de 8 GB. ¿Podría ser esta la razón detrás del aprovisionamiento de instancias en EMR también? Entonces, ¿cuándo se asignan los discos de tamaño 420 GB a una instancia?

Además, aquí está la salida de "df -hi" y "mount"

$ df -hi
Filesystem            Inodes   IUsed   IFree IUse% Mounted on
/dev/xvda1              640K    100K    541K   16% /
tmpfs                   932K       3    932K    1% /lib/init/rw
udev                    930K     454    929K    1% /dev
tmpfs                   932K       3    932K    1% /dev/shm
ip-10-182-182-151.ec2.internal:/mapr
                        100G     50G     50G   50% /mapr

$ mount
/dev/xvda1 on / type ext3 (rw,noatime)
tmpfs on /lib/init/rw type tmpfs (rw,nosuid,mode=0755)
proc on /proc type proc (rw,noexec,nosuid,nodev)
sysfs on /sys type sysfs (rw,noexec,nosuid,nodev)
udev on /dev type tmpfs (rw,mode=0755)
tmpfs on /dev/shm type tmpfs (rw,nosuid,nodev)
devpts on /dev/pts type devpts (rw,noexec,nosuid,gid=5,mode=620)
/var/run on /run type none (rw,bind)
/var/lock on /run/lock type none (rw,bind)
/dev/shm on /run/shm type none (rw,bind)
rpc_pipefs on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw)
ip-10-182-182-151.ec2.internal:/mapr on /mapr type nfs (rw,addr=10.182.182.151)
$ lsblk
NAME  MAJ:MIN RM   SIZE RO TYPE MOUNTPOINT
xvda1 202:1    0    10G  0 disk /
xvdb  202:16   0   420G  0 disk 
xvdc  202:32   0   420G  0 disk

Respuestas a la pregunta(1)

Su respuesta a la pregunta