Spark: saveAsTextFile ohne Komprimierung

Question

Oct 26, 2016, 03:41 PM

Spark: saveAsTextFile ohne Komprimierung

Standardmäßig verwenden neuere Versionen von Spark beim Speichern von Textdateien die Komprimierung. Beispielsweise

val txt = sc.parallelize(List("Hello", "world", "!"))
txt.saveAsTextFile("/path/to/output")

erzeugt Dateien in.deflate Format. Es ist ziemlich einfach, den Komprimierungsalgorithmus zu ändern, z. zum.gzip:

import org.apache.hadoop.io.compress._
val txt = sc.parallelize(List("Hello", "world", "!"))
txt.saveAsTextFile("/path/to/output", classOf[GzipCodec])

Aber es gibt einen Weg zusave RDD als reine Textdateien, d. h.ohne Komprimierung?

Antworten auf die Frage(2)

Top Fragen

0 die antwort

So laden Sie in Java nur CSV-Dateien auf den Server hoch

0 die antwort

Anpassung eines begrenzten Poisson-Prozesses mit variabler Rate

0 die antwort

Vim: Hervorheben langer Zeilen umschalten

0 die antwort

Python-Datenstruktur für eine Sammlung von Objekten mit wahlfreiem Zugriff basierend auf einem Attribut

0 die antwort

Benutzerdefinierte Sortierung in Pandas-Datenrahmen

Du bist sehr aktiv! Es ist großartig!

Spark: saveAsTextFile ohne Komprimierung

Antworten auf die Frage(2)

Ihre Antwort auf die Frage

Top Fragen