Spezifische Partitionen in der Spark-Dataframe-Schreibmethode überschreiben

Question

Jul 20, 2016, 08:00 PM

spark-dataframe apache-spark apache-spark-sql

Spezifische Partitionen in der Spark-Dataframe-Schreibmethode überschreiben

Ich möchte bestimmte Partitionen überschreiben, anstatt alle in Spark. Ich versuche den folgenden Befehl:

df.write.orc('maprfs:///hdfs-base-path','overwrite',partitionBy='col4')

wobei df ein Datenrahmen ist, dessen inkrementelle Daten überschrieben werden sollen.

hdfs-base-path enthält die Stammdaten.

Wenn ich den obigen Befehl versuche, werden alle Partitionen gelöscht und die in df vorhandenen in den hdfs-Pfad eingefügt.

Was meine Anforderung ist, nur die Partitionen zu überschreiben, die in df am angegebenen hdfs-Pfad vorhanden sind. Kann mir bitte jemand dabei helfen?

Antworten auf die Frage(18)

Top Fragen

0 die antwort

So vermeiden Sie die Ausnahme "Pfad der kreisförmigen Ansicht" beim Spring MVC-Test

0 die antwort

Anzeige von null Monaten mit SQL

0 die antwort

Schließen der Mongodb-Verbindung in node.js, während viele Daten eingefügt werden

0 die antwort

Erstellen mehrerer Python-Module in verschiedenen Verzeichnissen, die einen Teil der Paketstruktur gemeinsam nutzen

0 die antwort

PHP-Upload-Formular, PDF, Doc & Docx

Du bist sehr aktiv! Es ist großartig!

Spezifische Partitionen in der Spark-Dataframe-Schreibmethode überschreiben

Antworten auf die Frage(18)

Ihre Antwort auf die Frage

Top Fragen