Hadoop não-divisível TextInputFormat
Existe uma maneira de ter um arquivo inteiro enviado para um mapeador sem ser dividido?
eu liisto mas eu estou querendo saber se há outra maneira de fazer a mesma coisa sem ter que gerar um arquivo intermediário. Idealmente, gostaria de uma opção existente na linha de comando para o Hadoop.
Estou usando ostreaming
facilidade com scripts Python no Amazon EMR.