como evitar que o trabalho de hadoop falhe no arquivo de entrada corrompido

Estou executando o trabalho hadoop em muitos arquivos de entrada. Mas se um dos arquivos estiver corrompido, todo o trabalho falhará.

Como posso fazer o trabalho para ignorar o arquivo corrompido? talvez escreva para mim algum log de contador / erro, masnão falhar todo o trabalho