Sqoop: división de datos
Sqoop puede importar datos de múltiples tablas usando--query
cláusula pero no está claro si puede importar debajo de la consulta.
Seleccione deptid, avg (salario) del grupo emp por deptid
Otra pregunta es
importación sqoop --connect jdbc: mysql: // myserver: 1202 / --username = u1 --password = p1 --query 'Seleccione * de emp donde empid <1123 y $ CONDITIONS' --split-by empid --target -dir / uname / emp / salario
$ CONDITIONS y split-by se utilizan para realizar un procesamiento paralelo o podemos decir que importa datos de manera eficiente. El primero divide las filas según la condición y luego usa la lógica mínima y máxima en la clave primaria. Cuál es la diferencia entre estos dos($CONDITIONS, split-by)
. Si utilizamos ambos en la misma instrucción sqoop, ¿qué cláusula tendría la prioridad?
Gracias....