Как вывести список всех файлов в каталоге и его подкаталогах в hadoop hdfs
У меня есть папка в hdfs, в которой есть две подпапки, каждая из которых имеет около 30 подпапок, и, наконец, каждая содержит XML-файлы. Я хочу перечислить все xml-файлы, указав только путь к основной папке. Локально я могу сделать это сapache commons-io 's FileUtils.listFiles (). Я пробовал это
FileStatus[] status = fs.listStatus( new Path( args[ 0 ] ) );
но он только перечисляет две первые подпапки и не идет дальше. Есть ли способ сделать это в hadoop?