Suchergebnisse für Anfrage "join"
Skewed Dataset Join in Spark?
Ich verbinde zwei große Datensätze mit Spark RDD. Ein Datensatz ist stark verzerrt, sodass einige der Executor-Aufgaben lange dauern, bis der Job abgeschlossen ist. Wie kann ich dieses Szenario lösen?