Wie speichere ich einen DataFrame als komprimierte (gezippte) CSV?

Question

Oct 20, 2016, 10:32 PM

Wie speichere ich einen DataFrame als komprimierte (gezippte) CSV?

Ich benutze Spark 1.6.0 und Scala.

Ich möchte einen DataFrame als komprimiertes CSV-Format speichern.

Hier ist das, was ich bisher habe (nehme an, ich habe bereitsdf undsc wieSparkContext):

//set the conf to the codec I want
sc.getConf.set("spark.hadoop.mapred.output.compress", "true")
sc.getConf.set("spark.hadoop.mapred.output.compression.codec", "true")
sc.getConf.set("spark.hadoop.mapred.output.compression.codec", "org.apache.hadoop.io.compress.GzipCodec")
sc.getConf.set("spark.hadoop.mapred.output.compression.type", "BLOCK")

df.write
  .format("com.databricks.spark.csv")
  .save(my_directory)

Die Ausgabe ist nicht ingz Format

Antworten auf die Frage(8)

Top Fragen

0 die antwort

Wie kann ich das Erben von Klassen erzwingen, um eine statische Methode in C # zu implementieren?

0 die antwort

Hat jemand eine andere Verwendung von "var" als für LINQ gefunden?

0 die antwort

.htaccess / .htpasswd 500 Internal Server Error

0 die antwort

Kann nicht die Datenbank "test" öffnen, die vom Login angefordert wurde. Die Anmeldung ist fehlgeschlagen. Anmeldung fehlgeschlagen für Benutzer 'xyz \ ASPNET'

0 die antwort

reverse dataframe Zeilen 'bestellen mit Pandas [duplizieren]

Du bist sehr aktiv! Es ist großartig!

Wie speichere ich einen DataFrame als komprimierte (gezippte) CSV?

Antworten auf die Frage(8)

Ihre Antwort auf die Frage

Top Fragen