Hadoop: Stellen Sie das Verzeichnis als Eingabe für den MapReduce-Job bereit

Question

Nov 20, 2013, 12:13 PM

Hadoop: Stellen Sie das Verzeichnis als Eingabe für den MapReduce-Job bereit

Ich benutze Cloudera Hadoop. Ich kann ein einfaches MapReduce-Programm ausführen, in dem ich eine Datei als Eingabe für das MapReduce-Programm bereitstelle.

Diese Datei enthält alle anderen Dateien, die von der Mapper-Funktion verarbeitet werden sollen.

Aber ich stecke an einem Punkt fest.

/folder1
  - file1.txt
  - file2.txt
  - file3.txt

Wie kann ich den Eingabepfad zum MapReduce-Programm als angeben?"/folder1", damit jede Datei in diesem Verzeichnis verarbeitet werden kann?

Irgendwelche Ideen ?

EDIT:

1) Intiailly stellte ich das inputFile.txt als Eingang zum mapreduce Programm zur Verfügung. Es hat perfekt funktioniert.

>inputFile.txt
file1.txt
file2.txt
file3.txt

2) Anstatt eine Eingabedatei anzugeben, möchte ich jetzt ein Eingabeverzeichnis als arg [0] in der Befehlszeile bereitstellen.

hadoop jar ABC.jar /folder1 /output

Antworten auf die Frage(4)

Top Fragen

0 die antwort

Warum wird ValueType.GetHashCode () so implementiert, wie es ist?

0 die antwort

Warum kann jQuery 3 das Zeichen '#' in einem Attributselektor nicht identifizieren?

0 die antwort

Wie ein Label-Wert von der Webbenutzersteuerung über die Masterseite auf eine Inhaltsseite übertragen wird

0 die antwort

PHP cURL Echtzeit-Proxy (Stream-Datei)

0 die antwort

ugriff auf assoziative Arrays in P

Du bist sehr aktiv! Es ist großartig!

Hadoop: Stellen Sie das Verzeichnis als Eingabe für den MapReduce-Job bereit

Antworten auf die Frage(4)

Ihre Antwort auf die Frage

Top Fragen