como evitar que o trabalho de hadoop falhe no arquivo de entrada corrompido
Estou executando o trabalho hadoop em muitos arquivos de entrada. Mas se um dos arquivos estiver corrompido, todo o trabalho falhará.
Como posso fazer o trabalho para ignorar o arquivo corrompido? talvez escreva para mim algum log de contador / erro, masnão falhar todo o trabalho