Sqoop - Divisão de dados

Sqoop capaz de importar dados de várias tabelas usando--query , mas não está claro se é capaz de importar a consulta abaixo.

Selecionar deptid, média (salário) do grupo emp por deptid

Outra pergunta é

sqoop import --connect jdbc: mysql: // myserver: 1202 / --username = u1 --password = p1 --query 'Selecione * de emp onde empid <1123 e $ CONDITIONS' --split-by empid --target -dir / uname / emp / salário

$ CONDITIONS e split-by são usados para executar o processamento paralelo, ou podemos dizer, importar dados com eficiência. O antigo divide as linhas com base na condição e depois usa a lógica mínima e máxima na chave primária. Qual é a diferença entre esses dois($CONDITIONS, split-by). Se usarmos ambos na mesma instrução sqoop, qual cláusula teria prioridade?

Obrigado....

questionAnswers(2)

yourAnswerToTheQuestion