Explizite Sortierung in kartesischer Transformation in Scala Spark
Ich verwende die kartesische Transformation in Spark Scala. Wenn meine Eingabe aus 4 Elementen besteht (könnten Zahlen / Zeichen / Tupel sein), sagen Sie
var myRDD=sc.parallelize(Array("e1","e2","e3","e4"))
myRDD.cartesian (myRDD) würde alle möglichen Kombinationen von Paaren ergeben, aber nicht unbedingt in der richtigen Reihenfolge. Was ist ein kluger Weg, um diese Paare in Ordnung zu bringen? d.h.
Array((e1,e1), (e1,e2), (e1,e3), (e1,e4), (e2,e1), (e2,e2), (e2,e3), (e2,e4), (e3,e1), (e3,e2), (e3,e3), (e3,e4), (e4,e1), (e4,e2), (e4,e3), (e4,e4))