Umgang mit in Anführungszeichen eingeschlossenen Feldern (CSV) beim Importieren von Daten aus S3 in DynamoDB mithilfe von EMR / Hive

Ich versuche, mit EMR / Hive Daten aus S3 in DynamoDB zu importieren. Meine CSV-Datei enthält Felder, die in doppelte Anführungszeichen eingeschlossen und durch Komma getrennt sind. Beim Erstellen einer externen Tabelle in Hive kann ich ein Trennzeichen als Komma angeben. Wie kann ich jedoch festlegen, dass Felder in Anführungszeichen eingeschlossen sind?

Wenn ich nichts spezifiziere, sehe ich, dass die Werte in DynamoDB in zwei doppelten Anführungszeichen "value" stehen, was falsch zu sein scheint.

Ich benutze folgenden Befehl, um eine externe Tabelle zu erstellen. Gibt es eine Möglichkeit anzugeben, dass Felder in doppelte Anführungszeichen eingeschlossen sind?

CREATE EXTERNAL TABLE emrS3_import_1(col1 string, col2 string, col3 string, col4 string)  ROW FORMAT DELIMITED FIELDS TERMINATED BY '","' LOCATION 's3://emrTest/folder';

Anregungen wäre dankbar. Danke Jitendra

Antworten auf die Frage(7)

Ihre Antwort auf die Frage