Sqoop - Divisão de dados
Sqoop capaz de importar dados de várias tabelas usando--query
, mas não está claro se é capaz de importar a consulta abaixo.
Selecionar deptid, média (salário) do grupo emp por deptid
Outra pergunta é
sqoop import --connect jdbc: mysql: // myserver: 1202 / --username = u1 --password = p1 --query 'Selecione * de emp onde empid <1123 e $ CONDITIONS' --split-by empid --target -dir / uname / emp / salário
$ CONDITIONS e split-by são usados para executar o processamento paralelo, ou podemos dizer, importar dados com eficiência. O antigo divide as linhas com base na condição e depois usa a lógica mínima e máxima na chave primária. Qual é a diferença entre esses dois($CONDITIONS, split-by)
. Se usarmos ambos na mesma instrução sqoop, qual cláusula teria prioridade?
Obrigado....