Erklärung der Faltmethode des Funken RDD

Question

Jul 17, 2015, 03:11 PM

Erklärung der Faltmethode des Funken RDD

Ich verwende Spark-1.4.0, das für Hadoop-2.4 (im lokalen Modus) vorgefertigt ist, um die Summe der Quadrate einer DoubleRDD zu berechnen. Mein Scala-Code sieht aus wie

sc.parallelize(Array(2., 3.)).fold(0.0)((p, v) => p+v*v)

nd es gab ein überraschendes Ergebn97.0.

Dies ist im Vergleich zur Scala-Version von @ nicht sehr intuitifold

Array(2., 3.).fold(0.0)((p, v) => p+v*v)

was gibt die erwartete Antwort13.0.

Es ist sehr wahrscheinlich, dass ich aufgrund mangelnden Verständnisses einige knifflige Fehler im Code gemacht habe. Ich habe gelesen, wie die Funktion in @ verwendRDD.fold() sollte kommunikativ sein, ansonsten kann das Ergebnis von Partitionen usw. abhängen. Wenn ich also die Anzahl der Partitionen auf 1 ändere,

sc.parallelize(Array(2., 3.), 1).fold(0.0)((p, v) => p+v*v)

Der Code wird mir geben169.0 auf meiner Maschine!

Kann jemand erklären, was genau hier passiert?

Antworten auf die Frage(2)

Top Fragen

0 die antwort

Gleichzeitiges Drucken aller Werte aus mehreren Listen

0 die antwort

Wie finde ich alle Dateien, die nicht mit einem bestimmten Präfix beginnen, in der Bash?

0 die antwort

PHP: So deaktivieren Sie gefährliche Funktionen

0 die antwort

Ist es möglich, in KVC einen Platzhalter zu verwenden?

0 die antwort

Erhöhen der Linienbreite mit dem Shape Renderer in LibGDX

Du bist sehr aktiv! Es ist großartig!

Erklärung der Faltmethode des Funken RDD

Antworten auf die Frage(2)

Ihre Antwort auf die Frage

Top Fragen