¿Configurando parámetros hadoop con boto?
Estoy intentando habilitar la omisión de entrada incorrecta en mis trabajos de Amazon Elastic MapReduce. Estoy siguiendo la maravillosa receta descrita aquí:
http://devblog.factual.com/practical-hadoop-streaming-dealing-with-brittle-code
El enlace anterior dice que necesito configurar de alguna manera los siguientes parámetros de configuración en un trabajo de EMR:
mapred.skip.mode.enabled=true
mapred.skip.map.max.skip.records=1
mapred.skip.attempts.to.start.skipping=2
mapred.map.tasks=1000
mapred.map.max.attempts=10
¿Cómo configuro estos (y otros) parámetros mapred.XXX en un JobFlow usando Boto?