Spark braucht HDFS

Question

Aug 13, 2016, 12:44 AM

Spark braucht HDFS

Hallo kann mir jemand erklären, braucht Apache 'Spark Standalone' HDFS?

Wenn erforderlich, wie Spark die HDFS-Blockgröße während der Ausführung der Spark-Anwendung verwendet. Ich meine, ich versuche zu verstehen, welche Rolle HDFS während der Ausführung der Spark-Anwendung spielen wird.

ie @Spark-Dokumentation besagt, dass die Verarbeitungsparallelität über RDD-Partitionen und die Executors / Cores gesteuert wird.

ann mir bitte jemand helfen, das zu verstehe

Antworten auf die Frage(2)

Top Fragen

0 die antwort

Zusammenführen von Datei-Chunks in PHP

0 die antwort

Müssen Dateien geschlossen werden, die nicht auf sie verweisen?

0 die antwort

Warum hat VIM eine eigene Regex-Syntax?

0 die antwort

Wie teste ich eine Methode in einer abstrakten Klasse mit abstrakten Methoden?

0 die antwort

Python socket.gethostname

Du bist sehr aktiv! Es ist großartig!

Spark braucht HDFS

Antworten auf die Frage(2)

Ihre Antwort auf die Frage

Top Fragen