Wie schreibe ich die resultierende RDD in eine CSV-Datei in Spark Python

Question

Aug 08, 2015, 11:53 PM

pyspark csv python apache-spark file-writing

Wie schreibe ich die resultierende RDD in eine CSV-Datei in Spark Python

Ich habe eine resultierende RDDlabelsAndPredictions = testData.map(lambda lp: lp.label).zip(predictions). Dies hat in diesem Format ausgegeben:

[(0.0, 0.08482142857142858), (0.0, 0.11442786069651742),.....]

Ich möchte eine CSV-Datei mit einer Spalte für @ erstellelabels (der erste Teil des Tupels in der obigen Ausgabe) und einer fürpredictions (zweiter Teil der Tupelausgabe). Aber ich weiß nicht, wie ich mit Python in Spark in eine CSV-Datei schreiben soll.

Wie kann ich eine CSV-Datei mit der obigen Ausgabe erstellen?