Particionar en chispa mientras lee desde RDBMS a través de JDBC

Question

Apr 01, 2017, 12:42 AM

Estoy ejecutando spark en modo de clúster y leyendo datos de RDBMS a través de JDBC.

Según chispadocs, estos parámetros de partición describen cómo particionar la tabla cuando se lee en paralelo desde varios trabajadores:

partitionColumnlowerBoundupperBoundnumPartitions

Estos son parámetros opcionales.

¿Qué pasaría si no especifico esto?

¿Solo 1 trabajador leyó toda la información?Si aún se lee de forma paralela, ¿cómo divide los datos?

Respuestas a la pregunta(1)

¿Estructura de datos para mapeo parcial de múltiples teclas?

Llamando a la función miembro del número literal

Gson deserializa objetos anidados con InstanceCreator

a relación @JPA no se actualiza cuando se eliminan los hijos

UIGraphicsGetCurrentContext parece devolver nil