Lazy foreach auf einem Spark RDD

Question

Jul 21, 2015, 05:02 PM

Lazy foreach auf einem Spark RDD

Ich habe eine große RDD von Strings (erhalten durch eine Vereinigung von mehrerensc.textFile(...)).

Ich möchte jetzt nach einer bestimmten Zeichenfolge in dieser RDD suchen und die Suche stoppen, wenn eine "gut genug" Übereinstimmung gefunden wurde.

Ich könnte nachrüstenforeach, oderfilter, odermapzu diesem Zweck, aber alle diese werden durch jedes Element in dieser RDD iteriert, unabhängig davon, ob die Übereinstimmung erreicht wurde.

ibt es eine Möglichkeit, diesen Prozess kurzzuschließen und das Durchlaufen der gesamten RDD zu vermeide

Antworten auf die Frage(4)

Top Fragen

0 die antwort

Zeichnen Sie eine Linie in Echtzeit mit Swift 3.0

0 die antwort

XML-Fehler: AttValue: "oder 'expected

0 die antwort

Spark: Wie kann man "ReducedByKey" ausführen, wenn die Schlüssel numpy Arrays sind, die nicht hashbar sind?

0 die antwort

sparql erwartet eines von "where", "using"

0 die antwort

Wie man erkennt, wenn sich der Fensterinhalt geändert hat

Du bist sehr aktiv! Es ist großartig!

Lazy foreach auf einem Spark RDD

Antworten auf die Frage(4)

Ihre Antwort auf die Frage

Top Fragen