MapReduce-Job mit gemischten Datenquellen: HBase-Tabelle und HDFS-Dateien

Ich muss einen MR-Job implementieren, der auf Daten aus HBase-Tabellen- und HDFS-Dateien zugreift. Beispielsweise liest Mapper Daten aus HBase-Tabellen und aus HDFS-Dateien. Diese Daten haben denselben Primärschlüssel, aber ein anderes Schema. Ein Reduzierer fügt dann alle Spalten (aus HBase-Tabelle und HDFS-Dateien) zusammen.

Ich habe versucht, online zu suchen und konnte keinen Weg finden, um einen MR-Job mit einer solchen gemischten Datenquelle auszuführen. MultipleInputs funktionieren anscheinend nur für mehrere HDFS-Datenquellen. Bitte lassen Sie mich wissen, wenn Sie einige Ideen haben. Beispielcode wäre toll.

Antworten auf die Frage(3)

Ihre Antwort auf die Frage