Spark: Speichern von RDD in einem bereits vorhandenen Pfad in HDFS

Question

Jul 29, 2016, 06:29 PM

Spark: Speichern von RDD in einem bereits vorhandenen Pfad in HDFS

Ich kann die RDD-Ausgabe mit @ in HDFS speicher saveAsTextFile Methode. Diese Methode löst eine Ausnahme aus, wenn der Dateipfad bereits vorhanden ist.

Ich habe einen Anwendungsfall, in dem ich das RDDS in einem bereits vorhandenen Dateipfad in HDFS speichern muss. Gibt es eine Möglichkeit, die neuen RDD-Daten einfach an die Daten anzuhängen, die bereits im selben Pfad vorhanden sind?