Suchergebnisse für Anfrage "mapreduce"
GZIP-Unterstützung in Spark
Für ein Big-Data-Projekt plane ich die VerwendungFunke, das einige nette Features wie In-Memory-Berechnungen für wiederholte Workloads hat. Es kann auf lokal...
Mapper-Klasse nicht gefunden
Manchmal beklagt sich mein MR-Job, dass die MyMapper-Klasse nicht gefunden wurde. Und das muss ich job.setJarByClass (MyMapper.class) geben; um es zu sagen, ...
Lesen von HDFS und lokalen Dateien in Java
Ich möchte Dateipfade lesen, unabhängig davon, ob sie HDFS oder lokal sind. Derzeit übergebe ich die lokalen Pfade mit dem Präfix file: // und HDFS-Pfade mit...
Hadoop MapReduce-Sortierung reduziert die Ausgabe mit der Taste
Unten gibt es ein Kartenreduzierungsprogramm, das Wörter aus mehreren Textdateien zählt. Mein Ziel ist es, das Ergebnis in absteigender Reihenfolge in Bezug ...
Spark-Konfiguration: SPARK_MEM vs. SPARK_WORKER_MEMORY
In spark-env.sh können die folgenden Umgebungsvariablen konfiguriert werden:
MapReduce-Job mit gemischten Datenquellen: HBase-Tabelle und HDFS-Dateien
Ich muss einen MR-Job implementieren, der auf Daten aus HBase-Tabellen- und HDFS-Dateien zugreift. Beispielsweise liest Mapper Daten aus HBase-Tabellen und a...