Wenn Sie in Hive eine externe Tabelle mit einem S3-Speicherort erstellen, werden die Daten übertragen?

Wenn Sie eine externe Tabelle in Hive (auf Hadoop) mit einem Amazon S3-Quellspeicherort erstellen, werden die Daten auf das lokale Hadoop-HDFS übertragen.

externe Tabellenerstellungwenn Abfragen (MR-Jobs) auf der externen Tabelle ausgeführt werdennever (es werden nie Daten übertragen) und MR-Jobs lesen S3-Daten.

Was sind die Kosten, die hier für S3-Lesevorgänge anfallen? Gibt es einen einzigen Aufwand für die Übertragung von Daten an HDFS oder fallen keine Kosten für die Datenübertragung an, aber wenn der von Hive erstellte MapReduce-Auftrag auf dieser externen Tabelle ausgeführt wird, fallen die Lesekosten an.

Eine externe Beispieltabellendefinition wäre:

CREATE EXTERNAL TABLE mydata (key STRING, value INT)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '='
LOCATION 's3n://mys3bucket/';

Antworten auf die Frage(2)

Ihre Antwort auf die Frage