como carregar arquivos no cluster hadoop usando o apache pi
Tenho um script pig e preciso carregar arquivos do cluster hadoop local. Posso listar os arquivos usando o comando hadoop: hadoop fs –ls / repo / mydata, `mas quando tentei carregar arquivos no script pig, ele falhou. a instrução load é assim:
in = LOAD '/repo/mydata/2012/02' USING PigStorage() AS (event:chararray, user:chararray)
a mensagem de erro é:
Message: org.apache.pig.backend.executionengine.ExecException: ERROR 2118: Input path does not exist: file:/repo/mydata/2012/02
qualquer ideia? obrigad