Doppelte Datensätze in einer BigQuery-Tabelle entfernen

Ich plane, täglich inkrementelle Daten an eine BigQuery-Tabelle anzuhängen. Jedes Mal, wenn ich der vorhandenen Tabelle inkrementelle Daten hinzufüge, möchte ich doppelte Datensätze (basierend auf einer Primärschlüsselspalte) aus den vorhandenen Daten in der Tabelle entfernen. Ein Ansatz wäre:

Sammeln Sie den Schlüsselsatz aus den inkrementellen Daten (nennen wir ihnINCR_KEYS)Führen Sie eine Abfrage in den Zeilen von - aus.SELECT all_cols from table where pkey_col NOT IN (INCR_KEYS) - und speichern Sie die Ergebnisse in einer neuen Tabelle.Hängen Sie die inkrementellen Daten an die neue Tabelle an.

Bei diesem Ansatz geht es mir darum, dass eine Kopie einer großen Tabelle erstellt und meine Rechnungen erweitert werden.

Gibt es eine bessere Möglichkeit, dasselbe zu erreichen, ohne eine doppelte Tabelle zu erstellen?

Antworten auf die Frage(3)

Ihre Antwort auf die Frage