¿Cómo cargar archivos en el clúster hadoop usando apache pig?
Tengo un script de pig y necesito cargar archivos del clúster hadoop local. Puedo enumerar los archivos usando el comando hadoop: hadoop fs –ls / repo / mydata, `pero cuando intenté cargar archivos en script pig, falló. la declaración de carga es así:
in = LOAD '/repo/mydata/2012/02' USING PigStorage() AS (event:chararray, user:chararray)
el mensaje de error es:
Message: org.apache.pig.backend.executionengine.ExecException: ERROR 2118: Input path does not exist: file:/repo/mydata/2012/02
¿alguna idea? Gracia