Wie schreibe ich die resultierende RDD in eine CSV-Datei in Spark Python
Ich habe eine resultierende RDDlabelsAndPredictions = testData.map(lambda lp: lp.label).zip(predictions)
. Dies hat in diesem Format ausgegeben:
[(0.0, 0.08482142857142858), (0.0, 0.11442786069651742),.....]
Ich möchte eine CSV-Datei mit einer Spalte für @ erstellelabels
(der erste Teil des Tupels in der obigen Ausgabe) und einer fürpredictions
(zweiter Teil der Tupelausgabe). Aber ich weiß nicht, wie ich mit Python in Spark in eine CSV-Datei schreiben soll.
Wie kann ich eine CSV-Datei mit der obigen Ausgabe erstellen?