Wenn Sie in Hive eine externe Tabelle mit einem S3-Speicherort erstellen, werden die Daten übertragen?
Wenn Sie eine externe Tabelle in Hive (auf Hadoop) mit einem Amazon S3-Quellspeicherort erstellen, werden die Daten auf das lokale Hadoop-HDFS übertragen.
externe Tabellenerstellungwenn Abfragen (MR-Jobs) auf der externen Tabelle ausgeführt werdennever (es werden nie Daten übertragen) und MR-Jobs lesen S3-Daten.Was sind die Kosten, die hier für S3-Lesevorgänge anfallen? Gibt es einen einzigen Aufwand für die Übertragung von Daten an HDFS oder fallen keine Kosten für die Datenübertragung an, aber wenn der von Hive erstellte MapReduce-Auftrag auf dieser externen Tabelle ausgeführt wird, fallen die Lesekosten an.
Eine externe Beispieltabellendefinition wäre:
CREATE EXTERNAL TABLE mydata (key STRING, value INT)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '='
LOCATION 's3n://mys3bucket/';