Получить имя входного файла в потоковой программе hadoop
Я могу найти имя, если входной файл в классе сопоставления с помощью FileSplit при написании программы на Java.
Есть ли соответствующий способ сделать это, когда я пишу программу на Python (с использованием потоковой передачи?)
Я нашел следующее в потоковом документе hadoop на apache:
См. Настроенные параметры. Во время выполнения потокового задания имена «отображаемых» параметров преобразуются. Точки (.) Становятся символами подчеркивания (_). Например, mapred.job.id становится mapred_job_id, а mapred.jar становится mapred_jar. В вашем коде используйте имена параметров с подчеркиванием.
Но я до сих пор не могу понять, как использовать это в моем картографе.
Любая помощь высоко ценится.
Спасибо