Cerdo: número de control de mapeadores

Puedo controlar el número de reductores usando la cláusula PARALLEL en las declaraciones que resultan en reductores.

Quiero controlar el número de mapeadores. La fuente de datos ya está creada, y no puedo reducir el número de partes en la fuente de datos. ¿Es posible controlar el número de mapas generados por mis declaraciones de cerdo? ¿Puedo mantener un límite inferior y superior en la cantidad de mapas generados? ¿Es una buena idea controlar esto?

Intenté usar pig.maxCombinedSplitSize, mapred.min.split.size, mapred.tasktracker.map.tasks.maximum, etc., pero parecen no ayudar.

¿Puede alguien ayudarme a comprender cómo controlar la cantidad de mapas y posiblemente compartir un ejemplo de trabajo?

Respuestas a la pregunta(2)

Su respuesta a la pregunta