Как прочитать несколько текстовых файлов в одном RDD?
Я хочу прочитать несколько текстовых файлов из местоположения hdfs и выполнить сопоставление с ним в итерации, используя spark.
JavaRDD<String> records = ctx.textFile(args[1], 1);
способен читать только один файл за раз.
Я хочу прочитать более одного файла и обработать их как один RDD. Как?