Porco: número de controle dos mapeadores

Eu posso controlar o número de redutores usando a cláusula PARALLEL nas instruções que resultam em redutores.

Eu quero controlar o número de mapeadores. A fonte de dados já está criada e não posso reduzir o número de partes na fonte de dados. É possível controlar o número de mapas gerados pelas minhas declarações de porco? Posso manter um limite mínimo e máximo no número de mapas gerados? É uma boa ideia controlar isso?

Eu tentei usar pig.maxCombinedSplitSize, mapred.min.split.size, mapred.tasktracker.map.tasks.maximum etc, mas eles parecem não ajudar.

Alguém pode me ajudar a entender como controlar o número de mapas e possivelmente compartilhar um exemplo de trabalho?

questionAnswers(2)

yourAnswerToTheQuestion