Spark Lesen von Python3 Pickle als Eingabe

Question

Mar 26, 2016, 09:56 AM

apache-spark serialization python pyspark rdd

Spark Lesen von Python3 Pickle als Eingabe

Meine Daten sind als Sätze von Python 3-Dateien verfügbar. Die meisten von ihnen sind Serialisierung von PandasDataFrames.

Ich würde gerne Spark verwenden, da ich mehr Arbeitsspeicher und CPU benötige, die ein Computer haben kann. Außerdem verwende ich HDFS für die verteilte Speicherung.

ls Anfänger habe ich keine relevanten Informationen zur Verwendung von pickle-Dateien als Eingabedatei gefunde

Gibt es das? Wenn nicht, gibt es eine Problemumgehung?

Danke vielmal

Antworten auf die Frage(2)

Top Fragen

0 die antwort

Jenkins Verbindung zum Gerrit-Repository fehlgeschlagen (Windows-Installation)

0 die antwort

Wie verwende ich die YouTube-API, um zu überprüfen, ob ein Video eingeschränkt ist?

0 die antwort

Display Verzeichnisstruktur mit Größe in Powershell

0 die antwort

Wie kann ich das Symbol Pfeil von Spinner in Android durch ein Bild ersetzen?

0 die antwort

Wie kann ich dieses lineare Gleichungssystem lösen?

Du bist sehr aktiv! Es ist großartig!

Spark Lesen von Python3 Pickle als Eingabe

Antworten auf die Frage(2)

Ihre Antwort auf die Frage

Top Fragen