Hadoop неразборный TextInputFormat
Есть ли способ отправить весь файл в маппер без разделения?
я прочиталэтот но мне интересно, есть ли другой способ сделать то же самое, не создавая промежуточный файл. В идеале, я хотел бы, чтобы существующая опция в командной строке Hadoop.
Я используюstreaming
средство со скриптами Python на Amazon EMR.