Doppelte Datensätze in einer BigQuery-Tabelle entfernen

Question

Sep 10, 2012, 09:15 AM

Doppelte Datensätze in einer BigQuery-Tabelle entfernen

Ich plane, täglich inkrementelle Daten an eine BigQuery-Tabelle anzuhängen. Jedes Mal, wenn ich der vorhandenen Tabelle inkrementelle Daten hinzufüge, möchte ich doppelte Datensätze (basierend auf einer Primärschlüsselspalte) aus den vorhandenen Daten in der Tabelle entfernen. Ein Ansatz wäre:

Sammeln Sie den Schlüsselsatz aus den inkrementellen Daten (nennen wir ihnINCR_KEYS)Führen Sie eine Abfrage in den Zeilen von - aus.SELECT all_cols from table where pkey_col NOT IN (INCR_KEYS) - und speichern Sie die Ergebnisse in einer neuen Tabelle.Hängen Sie die inkrementellen Daten an die neue Tabelle an.

Bei diesem Ansatz geht es mir darum, dass eine Kopie einer großen Tabelle erstellt und meine Rechnungen erweitert werden.

Gibt es eine bessere Möglichkeit, dasselbe zu erreichen, ohne eine doppelte Tabelle zu erstellen?

Antworten auf die Frage(3)

Top Fragen

0 die antwort

Pandas - Datenrahmen anhand von Datumsangaben in mehrere Datenrahmen aufteilen?

0 die antwort

Wie man Vereinigungs-, Schnitt-, Differenz- und Umkehrdaten in Java macht

0 die antwort

Odata Abfrageergebnis standardmäßig erweitern

0 die antwort

Change Register / Lost Password “Aktionslinks” URLs, Titel & Modify Error-Seiten. Theme Mein Login Plugin angetriebenes Wordpress Netzwerk multisite

0 die antwort

Warten Sie, bis die Ausführung der Schleife mit asynchronen Netzwerkanforderungen abgeschlossen ist.

Du bist sehr aktiv! Es ist großartig!

Doppelte Datensätze in einer BigQuery-Tabelle entfernen

Antworten auf die Frage(3)

Ihre Antwort auf die Frage

Top Fragen