Definindo parâmetros hadoop com boto?
Estou tentando ativar a entrada incorreta ignorando meus trabalhos do Amazon Elastic MapReduce. Estou seguindo a maravilhosa receita descrita aqui:
http://devblog.factual.com/practical-hadoop-streaming-dealing-with-brittle-code
O link acima diz que preciso definir de alguma forma os seguintes parâmetros de configuração em uma tarefa EMR:
mapred.skip.mode.enabled=true
mapred.skip.map.max.skip.records=1
mapred.skip.attempts.to.start.skipping=2
mapred.map.tasks=1000
mapred.map.max.attempts=10
Como faço para definir esses (e outros) parâmetros mapred.XXX em um JobFlow usando Boto?