Sqoop - Datenaufteilung

Sqoop kann mit @ Daten aus mehreren Tabellen importier--query -Klausel, aber nicht klar, ob es in der Lage ist, unter query zu importieren.

Wählen Sie deptid, avg (Gehalt) aus emp group von deptid

Eine andere Frage ist

sqoop import --connect jdbc: mysql: // myserver: 1202 / --username = u1 --password = p1 --query 'Wähle * aus emp wobei empid <1123 und $ CONDITIONS' --split-by empid - Zielverzeichnis / uname / emp / Gehalt

$ CONDITIONS und split-by werden für die parallele Verarbeitung verwendet, oder wir können sagen, dass Daten effizient importiert werden. Teilen Sie die Zeilen früher basierend auf der Bedingung auf und verwenden Sie später die Min- und Max-Logik für den Primärschlüssel. Was ist der Unterschied zwischen diesen beiden($CONDITIONS, split-by). Wenn wir beide in derselben sqoop-Anweisung verwenden, welche Klausel hat dann die Priorität?

Vielen Dank...

Antworten auf die Frage(4)

Ihre Antwort auf die Frage