Hadoop Nicht teilbares TextInputFormat

Gibt es eine Möglichkeit, eine ganze Datei an einen Mapper zu senden, ohne sie zu teilen?

ich habe gelesendiese Aber ich frage mich, ob es eine andere Möglichkeit gibt, dasselbe zu tun, ohne eine Zwischendatei generieren zu müssen. Idealerweise hätte ich gerne eine vorhandene Option in der Kommandozeile zu Hadoop.

Ich benutze diestreaming Einrichtung mit Python-Skripten auf Amazon EMR.

Antworten auf die Frage(1)

Ihre Antwort auf die Frage